Classical mechanics

Classical mechanics

references:

​ [1] 杨望,理论力学讲义
​ [2] H.Goldstein, C. Poole, J.Safko, Classical mechanics , 高等教育出版社
​ [3] 高显,经典力学,科学出版社
​ [4] 金尚年,理论力学(第三版),高等教育出版社


Chapter 0 多元函数的导数和微分

E=mc2(0.0)E=mc^2 \tag{0.0}

​ 设 f(x1,,xn)f\left(x_1,\dots,x_n\right)nn 个变量 x1,,xnx_1,\dots,x_n 的光滑函数,其中 xiR,1in,f(x1,,xn)Rx_i\in \R,1\leq i\leq n,f\left(x_1,\dots,x_n\right)\in \R .我们采取下述记号,

f[xj]=f(x1,,xn)f[x_j]=f\left(x_1,\dots,x_n\right)

​ 那么偏导数可以写为

fxi[xj]=limϵ0f[xj+ϵδij]f[xj]ϵ(0.1)\frac{\partial f}{\partial x_i}[x_j]=\lim_{\epsilon \to 0}\frac{f[x_j+\epsilon\delta_{ij}]-f[x_j]}{\epsilon}\tag{0.1}

​ 当自变量有如下变换时

x1x1+Δx1,x2x2+Δx2,,xnxn+Δxnx_1\to x_1+\Delta x_1,x_2\to x_2+\Delta x_2,\dots,x_n\to x_n+\Delta x_n

(全)微分可以写成

Δf=f[xj+Δxj]f[xj]=i=1nfxi[xj]Δxi+O(ΔxiΔxj)(0.2)\begin{aligned} \Delta f&=f[x_j+\Delta x_j]-f[x_j]\\ &=\sum_{i=1}^n\frac{\partial f}{\partial x_i}[x_j]\Delta x_i+O\left(\Delta x_i\Delta x_j\right) \end{aligned}\tag{0.2}

Chapter 1 变分法

1.1 泛函

​ 函数就是具体的映射关系

f:ty=f(t)(1.1)f:t\mapsto y=f\left(t\right)\tag{1.1}

1.1.1 泛函的概念

​ 泛函,即函数到数的影射,记函数集合 F={f1,f2,f3,}\mathcal{F}=\{f_1,f_2,f_3,\cdots\} .函数 ff 的泛函记作 S[f]S[f] ,即

fS=S[f],FC(1.2)f\mapsto S=S[f],\quad\mathcal{F}\to \mathbf{C}\tag{1.2}

1.1.2 泛函的具体形式

​ 三维空间中曲面方程记为 z=ϕ(x,y)z=\phi\left(x,y\right) ,则曲面面积 AA 为二元函数 ϕ(x,y)\phi\left(x,y\right) 的泛函

A=A[ϕ]=区域dxdy1+(ϕx)2+(ϕy)2A=A[\phi]=\iint_{区域}\mathrm{d}x\mathrm{d}y\sqrt{1+\left(\frac{\partial\phi}{\partial x}\right)^2+\left(\frac{\partial \phi}{\partial y}\right)^2}

​ 经典力学种所遇到的泛函通常可以写成积分形式:

S[f]=t1t2dtL(t,f(t),f(t),f(t),)(1.3)S[f]=\int_{t_1}^{t_2}\mathrm{d}tL\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right)\tag{1.3}

这里的被积函数 L=L(t,f(t),f(t),f(t),)L=L\left(t,f\left(t\right),f'\left(t\right),f''\left(t\right),\cdots\right) 是函数 f(t)f\left(t\right) 及其导数的一般函数.

1.2 变分

1.2.1 变分的概念

​ 泛函为函数到数的映射,函数本身的无穷小变化,以及由之引起的泛函的变化即变分.若函数 f(t)f\left(t\right) 变成了另外一个函数 f(t)f~(t)f\left(t\right)\to \tilde{f}\left(t\right) ,且假设两者相差无穷小,则函数 f(t)f\left(t\right) 的变分 δf\delta f 定义为

δf(t):=f~(t)f(t)(1.4)\boxed{\delta f\left(t\right):=\tilde{f}\left(t\right)-f\left(t\right)} \tag{1.4}

​ 函数的变分 δf\delta f 是因为函数本身发生了变化,而与自变量 tt 无关

f(t)f~(t)(f+δf)(t)=f(t)+δf(t)(1.5)f\left(t\right)\to\tilde{f}\left(t\right)\equiv\left(f+\delta f\right)\left(t\right)=f\left(t\right)+\delta f\left(t\right)\tag{1.5}

1.2.2 变分的运算规则

​ 函数的变分和微分同为无穷小变化,形式上的运算规则基本相同.

δ(fn)=nfn1δfδ(af1+bf2)=aδf1+bδf2,δ(f1f2)=(δf1)δf2+δf1(δf2)(1.6)\begin{aligned} &\delta\left(f^n\right)=nf^{n-1}\delta f\\ \delta\left(af_1+bf_2\right)=a\delta f_1&+b\delta f_2,\quad \delta\left(f_1f_2\right)=\left(\delta f_1\right)\delta f_2+\delta f_1\left(\delta f_2\right) \end{aligned}\tag{1.6}

​ 另一个重要且非常有用的性质是,变分和微分可以交换顺序.

δ(df)=d(δf)(1.7)\boxed{\delta\left(\mathrm df\right)=\mathrm d\left(\delta f\right)}\tag{1.7}

proofproof

f~(t+dt)f(t)=f~(t+dt)f~(t)+f~(t)f(t)=δf+df+d(δf)=f~(t+dt)f(t+dt)+f(t+dt)f(t)=δf+df+δ(df)\begin{aligned} \tilde{f}\left(t+\mathrm dt\right)-f\left(t\right)&=\tilde{f}\left(t+\mathrm dt\right)-\tilde f\left(t\right)+\tilde f\left(t\right)-f\left(t\right)=\delta f+\mathrm df+\mathrm d\left(\delta f\right)\\ &=\tilde{f}\left(t+\mathrm dt\right)-f\left(t+\mathrm dt\right)+f\left(t+\mathrm dt\right)-f\left(t\right)=\delta f+\mathrm df+\delta\left(\mathrm df\right) \end{aligned}

因此可以推出

δ(ddtf(t))=ddt(δf(t))(1.8)\boxed{\delta\left(\frac{\mathrm d}{\mathrm dt}f\left(t\right)\right)=\frac{\mathrm d}{\mathrm dt}\left(\delta f\left(t\right)\right)}\tag{1.8}

1.3 泛函导数

1.3.1 泛函导数的概念

​ 对于一阶导数

df(t)=df(t)dtdt\mathrm d f\left(t\right)=\frac{\mathrm d f\left(t\right)}{\mathrm dt}\mathrm dt

​ 类比普通函数的导数.对于泛函 S[f]S[f] ,其变分是由函数的变分引起的:

S[f~]=S[f+ϵδf]=S[f]+ϵδS[f]+ϵ22δ2S[f]+ϵ33!δ3S[f]+(1.9)\begin{equation} \begin{aligned} S[\tilde f]=&S[f+\epsilon\delta f]\\ =&S[f]+\epsilon\delta S[f]+\frac{\epsilon^2}{2}\delta^2S[f]+\frac{\epsilon^3}{3!}\delta^3S[f]+\cdots \end{aligned} \end{equation}\tag{1.9}

定义

δS[f]=dtδSδf(t)δf(t)(1.10)\boxed{\delta S[f]=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.10}

其中 δS\delta S 是泛函的一阶变分, δSδf(t)\frac{\delta S}{\delta f\left(t\right)}一阶泛函导数.

​ 类比函数的高阶导数,高阶泛函导数定义为

δ2S[f]:=dt1dt2δ2Sδf(t1)δf(t2)δf(t1)δf(t2)(1.11)\delta^2S[f]:=\int\mathrm dt_1\int \mathrm dt_2\frac{\delta ^2 S}{\delta f\left(t_1\right)\delta f\left(t_2\right)}\delta f\left(t_1\right)\delta f\left(t_2\right) \tag{1.11}

1.3.2 泛函导数的操作定义

​ 将 S[f+ϵδf]S[f+\epsilon\delta f] 视为 ϵ\epsilon 的普通函数,将式(1.9)视作关于 ϵ\epsilon 的普通泰勒展开:

S[f+ϵδf]=S[f]+ϵddϵS[f+ϵδf]ϵ=0+ϵ22d2dϵ2S[f+ϵδf]ϵ=0+(1.12)S[f+\epsilon\delta f]=S[f]+\left.\epsilon\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\left.\frac{\epsilon^2}{2}\frac{\mathrm d^2}{\mathrm d \epsilon^2}S[f+\epsilon\delta f]\right |_{\epsilon=0}+\cdots \tag{1.12}

即有

δS=ddϵS[f+ϵδf]ϵ=0=dtδSδf(t)δf(t)(1.13)\boxed{\delta S=\left.\frac{\mathrm d}{\mathrm d \epsilon}S[f+\epsilon\delta f]\right |_{\epsilon=0}=\int\mathrm dt\frac{\delta S}{\delta f\left(t\right)}\delta f\left(t\right)}\tag{1.13}

​ 对于式(1.3)形式的泛函

S[f+δf]=t1t2dtL(t,f+δf,f+δf,)S[f+\delta f]=\int_{t_1}^{t_2}\mathrm dtL\left(t,f+\delta f,f'+\delta f’,\cdots\right)

可以得到

δS=t1t2dtddϵL(t,f+ϵδf,f+ϵδf,)ϵ=0=t1t2dt(Lfδf+Lfδf+)δL(1.14)\begin{equation} \begin{aligned} \delta S&=\int_{t_1}^{t_2}\mathrm dt\left .\frac{\mathrm d}{\mathrm d\epsilon}L\left(t,f+\epsilon\delta f,f'+\epsilon\delta f',\cdots\right)\right |_{\epsilon=0}\\ &=\int_{t_1}^{t_2}\mathrm dt\underbrace{\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\cdots\right)}_{\equiv\delta L} \end{aligned} \end{equation}\tag{1.14}

其中被积函数为 LL 的变分 δL\delta L ,其与微分 dL\mathrm d L 形式全同.这意味着

δS=δ(t1t2dtL)=t1t2dtδL(1.15)\delta S=\delta\left(\int_{t_1}^{t_2}\mathrm dtL\right)=\int_{t_1}^{t_2}\mathrm dt\delta L\tag{1.15}

​ 我们用分部积分的方法进行处理

Lfδf=变分和求导交换顺序ddt(Lfδf)全导数ddt(Lf)δf(1.16)\frac{\partial L}{\partial f'}\delta f'\xlongequal{变分和求导交换顺序} \underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\delta f\right)}_{全导数}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f\tag{1.16}

类似的

Lfδf=ddt(Lfδf)ddt(Lf)δf=ddt(Lfδfddt(Lf)δf)全导数+d2dt2(Lf)δf(1.17)\begin{equation} \begin{aligned} \frac{\partial L}{\partial f''}\delta f’' &= \frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f'\\ &=\underbrace{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\delta f'-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f''}\right)\delta f\right)}_{全导数}+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f \end{aligned} \end{equation}\tag{1.17}

因此

δS=t1t2dt[Lfδfddt(Lf)δf+d2dt2(Lf)δf+dBdt]=t1t2dt[Lfddt(Lf)+d2dt2(Lf)]f+Bt1t2(1.18)\begin{equation} \begin{aligned} \delta S=&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}\delta f-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f-\cdots+\frac{\mathrm d\mathcal B}{\mathrm dt}\right]\\ =&\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)-\cdots\right]\partial f+\left.\mathcal B \right |_{t_1}^{t_2} \end{aligned} \end{equation}\tag{1.18}

​ 这里 dBdt\frac{\mathrm d\mathcal B}{\mathrm dt} 代表全导数项,积分到最后得到的 Bt1t2\left. \mathcal B \right |_{t_1}^{t_2} 被称作边界项.

​ 两个被积函数“相差全导数”,或者两个积分“相差边界项”,这件事在变分法种非常重要,用 \simeq 来表示

L1L2    L1=L2+dF(t,f,f,)dt(1.19)\boxed{L_1\simeq L_2 \iff L_1=L_2+\frac{\mathrm dF\left(t,f',f'',\cdots\right)}{\mathrm d t}} \tag{1.19}

以及

L1L2    S1=S2+Ft1t2L_1\simeq L_2\iff S_1=S_2+\left . F\right |_{t_1}^{t_2}

式(1.16)和(1.17)可以写成

Ffδfddt(Lf)δfFfδf=d2dt2(Lf)δf(1.20)\frac{\partial F}{\partial f'}\delta f'\simeq-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\delta f',\frac{\partial F}{\partial f''}\delta f''=\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)\delta f \tag{1.20}

1.3.3 计算一阶泛函导数的标准手续
  1. 将变分符号 δ\delta 移到积分号内:

    δS=dtL(t,f,f,)(1.21)\delta S=\int \mathrm dtL\left(t,f',f'',\cdots\right)\tag{1.21}

  2. 按照类似复合函数求导的规则,计算 δL\delta L

    δS=dt(Lfδf+Lfδf+Lfδf+)(1.22)\delta S=\int \mathrm dt\left(\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial f'}\delta f'+\frac{\partial L}{\partial f''}\delta f''+\cdots\right) \tag{1.22}

  3. 做分部积分

  4. 提取 δf\delta f 前系数,即一阶泛函导数

    δSdt[Lfddt(Lf)+d2dt2(Lf)+]δf(1.23)\delta S\simeq\int \mathrm dt\left[\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots\right ]\delta f \tag{1.23}

    δSδf=Lfddt(Lf)+d2dt2(Lf)+(1.24)\boxed{\frac{\delta S}{\delta f}=\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)+\frac{\mathrm d^2}{\mathrm dt^2}\left(\frac{\partial L}{\partial f''}\right)+\cdots} \tag{1.24}

Example 1.1

​ 考虑泛函 S[f]=dt[(f(t))2(f(t))2]S[f]=\int\mathrm dt\left[\left(f'\left(t\right)\right)^2-\left(f\left(t\right)\right)^2\right] ,有

δS=dtδ(f2f2)=d(2fδf2fδf)=dt(2f2f)δf\begin{aligned} \delta S=&\int \mathrm dt\delta\left(f'^2-f^2\right)=\int\mathrm d\left(2f'\delta f'-2f\delta f\right)\\ =&\int \mathrm dt\left(-2f''-2f\right)\delta f \end{aligned}

因此一阶泛函导数为

δSδf=2f2f\frac{\delta S}{\delta f}=-2f''-2f

Example 1.2

​ 考虑泛函 S[f]=dt[f(t)f(t)+f(t)f(t)]S[f]=\int \mathrm dt\left[f\left(t\right)f'\left(t\right)+f'\left(t\right)f''\left(t\right)\right],有

δS[f]=dt(δff+fδf+δff+fδf)=dt(ff+ff)δf=0\begin{aligned} \delta S[f]=&\int \mathrm dt\left(\delta ff'+f\delta f'+\delta f'f''+f'\delta f''\right)\\ =&\int\mathrm dt\left(f'-f'+f''-f''\right)\delta f=0 \end{aligned}

实际上

ff+ff=ddt(12(f2+f2))ff'+f'f''=\frac{\mathrm d}{\mathrm dt}\left(\frac 12\left(f^2+f'^2\right)\right)

1.4 泛函极值

1.4.1 泛函极值的必要条件

​ 显然泛函 S[f]S[f]f=f(t)f=\overline f\left(t\right) 时取极小(大)值时,只有不发生偏移,即 δf=0\delta f=0 时取极值 .另一方面,由式(1.12),S[f+ϵδf]S[\overline f+\epsilon \delta f] 可看作参数 ϵ\epsilon 的普通函数,在 ϵ=0\epsilon=0 处取极值.结合泛函导数的定义,有

δS[f]=dtδS[f]δfδff=dS[f+ϵδf]dϵϵ=0=0(1.25)\delta S[\overline f]=\int \mathrm dt\left .\frac{\delta S[f]}{\delta f}\delta f\right|_{\overline f}=\left .\frac{\mathrm dS[\overline f+\epsilon \delta f]}{\mathrm d\epsilon}\right |_{\epsilon =0}=0\tag{1.25}

由此得到泛函在 f=f(t)f=\overline f\left(t\right) 时取极值,即要求泛函的一阶变分为零:

δS[f]=0(1.26)\boxed{\delta S[\overline f]=0}\tag{1.26}

1.4.2 欧拉-拉格朗日方程

​ 一类常见的泛函具有如下形式

S[f]=dtL(t,f(t),f(t))(1.27)S[f]=\int \mathrm dt L\left(t,f\left(t\right),f'\left(t\right)\right)\tag{1.27}

根据式(1.26),泛函取极值的必要条件是

δSδfddt(Lf)Lf=0(1.28)-\frac{\delta S}{\delta f}\equiv\boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)-\frac{\partial L}{\partial f}=0}\tag{1.28}

式(1.28)是关于 f(t)f\left(t\right) 的二阶微分方程,被称为变分问题的欧拉-拉格朗日方程(Euler-Lagrange equation).

​ 对 LL 直接求全导数

dLdt=Lt+Lff+Lff=Lt+Lff+ddt(Lff)ddt(Lf)f=Lt(Lfddt(Lf))=0f+ddt(Lff)\begin{aligned} \frac{\mathrm dL}{\mathrm dt}=&\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\partial L}{\partial f'}f''=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial f}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right)-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)f'\\ =&\frac{\partial L}{\partial t}-\underbrace{\left(\frac{\partial L}{\partial f}-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}\right)\right)}_{=0}f'+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'\right) \end{aligned}

因此当欧拉-拉格朗日方程(1.28)满足时,下式也成立

ddt(LffL)+Lt=0(1.29)\boxed{\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial f'}f'-L\right)+\frac{\partial L}{\partial t}=0} \tag{1.29}

一个立即的结论是,若 LL 不显含积分变量 tt

Lt=0LffL=const(1.30)\frac{\partial L}{\partial t}=0\tag{1.30}\Rightarrow \frac{\partial L}{\partial f'}f'-L=const

​ 对于更一般的泛函式(1.3),其取极值的必要条件是

δSδf=n=0(1)ndndtn(Lf(n))=0(1.31)\frac{\delta S}{\delta f}=\sum_{n=0}\left(-1\right)^n\frac{\mathrm d^n}{\mathrm dt^n}\left(\frac{\partial L}{\partial f^{\left(n\right)}}\right)=0\tag{1.31}

Example 1.3

​ 平面上两固定点直接由任意光滑曲线连接,曲线方程基座 y=f(x)y=f\left(x\right) ,曲线长度为 S=dx1+(f(x))2S=\int \mathrm dx\sqrt{1+\left(f'\left(x\right)\right)^2} ,变分得到

δS=dxf1+f2δf=dxf(1+f2)3/2δf\delta S=\int \mathrm dx\frac{f'}{\sqrt{1+f'^2}}\delta f'=-\int \mathrm dx\frac{f''}{\left(1+f'^2\right)^{3/2}}\delta f

于是曲线长度取极值的必要条件即 f(x)f\left(x\right) 满足 f(1+f2)3/2=0\frac{f''}{\left(1+f'^2\right)^{3/2}}=0 ,其等价于 f=0f''=0 ,通解为 y=ax+by=ax+b .

Example 1.4(最速下降曲线)

​ 当小球下降到 yy 处时,12mv2=mgy\frac 12m\boldsymbol{v}^2=mgy ,因此速度大小 vv=2gyv\equiv|\boldsymbol v|=\sqrt{2gy} ,下落到 AA 点的用时

T[y]=dx1+y22gyT[y]=\int \mathrm dx \frac{\sqrt{1+y'^2}}{\sqrt{2gy}}

观察到被积函数 L=1+y22gyL=\frac{\sqrt{1+y'^2}}{\sqrt{2gy}}xx 无关,即式(1.30)的情况

LffL=12gy1+y2=const\frac{\partial L}{\partial f'}f'-L=-\frac{1}{\sqrt{2gy}\sqrt{1+y'^2}}=const

y(x)y\left(x\right) 满足

y(1+y2)=const(1.32)y\left(1+y'^2\right)=const\tag{1.32}

可以验证式(1.32)有参数方程解,y(θ)=a(1cosθ)y\left(\theta\right)=a\left(1-\cos\theta\right)x(θ)=a(θsinθ)x\left(\theta\right)=a\left(\theta -\sin \theta\right) ,其所描述的曲线即为摆线(cycloid)

1.4.3 多个变量和多元函数

​ 考虑泛函

S=S[f1,f2,]=dtL(t,f1,f2,,f1,f2,)(1.33)S=S[f_1,f_2,\cdots]=\int \mathrm dtL\left(t,f_1,f_2,\cdots,f_1',f_2',\cdots\right)\tag{1.33}

其极值同样要求

δS=dt(δSδf1δf1+δSδf2δf2+)=0(1.34)\delta S=\int \mathrm dt\left(\frac{\delta S}{\delta f_1}\delta f_1+\frac{\delta S}{\delta f_2}\delta f_2+\cdots\right)=0\tag{1.34}

因为函数 f1,f2,f_1,f_2,\cdots 相互独立,其变分 δf1,δf2,\delta f_1,\delta f_2,\cdots 也是相互独立的,因此上述式子要求每一项的系数都为零,于是泛函取极值的要求

δSδf1=0, δSδf2=0, (1.35)\frac{\delta S}{\delta f_1}=0,\ \frac{\delta S}{\delta f_2}=0,\ \cdots\tag {1.35}

Example 1.5

​ 考虑依赖于两个函数 f(t)f\left(t\right)n(t)n\left(t\right) 的泛函

S[f.n]=dt12[1n(t)(f(t))2n(t)(f(t))2]S[f.n]=\int \mathrm dt\frac 12\left[\frac{1}{n\left(t\right)}\left(f'\left(t\right)\right)^2-n\left(t\right)\left(f\left(t\right)\right)^2 \right]

首先对 f(t)f\left(t\right) 做变分,得到

δS=dt12(1n2fδfn2fδf)dt[ddt(fn)nf]δf\delta S=\int \mathrm dt\frac12\left(\frac{1}{n}2f'\delta f'-n2f\delta f \right)\simeq\int \mathrm dt\left[-\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)-nf \right]\delta f

因此 δS=0\delta S=0,要求

δSδf=ddt(fn)+nf=0(1.36)-\frac{\delta S}{\delta f}=\frac{\mathrm d}{\mathrm dt}\left(\frac{f'}{n}\right)+nf=0\tag{1.36}

再对 n(t)n\left(t\right) 做变分,得到

δS=dt12(1n2f2f2)δn\delta S=\int \mathrm dt\frac{1}{2}\left(-\frac{1}{n^2}f'^2-f^2\right)\delta n

因此 δS=0\delta S=0,要求

δSδn=12n2f2+12f2(1.37)-\frac{\delta S}{\delta n}=\frac{1}{2n^2}f'^2+\frac12f^2\tag{1.37}

泛函 S[f,n]S[f,n] 取极值的必要条件即 f(t)f\left(t\right)n(t)n\left(t\right) 满足式(1.36)和(1.37)

​ 泛函中的函数也可以是多元函数,以单个函数 ff 的泛函 S[f]S[f] 为例,设 ffttxx 的二元函数 f=f(t,x)f=f\left(t,x\right) .简单起见,我们只考虑 LL 含有 ff 的一阶导数,泛函具有形式

S=dtdxL(t,x,f,ft,fx)(1.38)S=\iint \mathrm dt\mathrm dxL\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\tag{1.38}

同样按照之前的步骤,泛函的一阶变分为

δS=dtdxδL(t,x,f,ft,fx)=dtdx[Lfδf+L(ft)δ(ft)+L(fx)δ(fx)]=dtdx[Lft(L(ft))x(L(fx))]δf\begin{aligned} \delta S=&\iint \mathrm dt\mathrm dx\delta L\left(t,x,f,\frac{\partial f}{\partial t},\frac{\partial f}{\partial x}\right)\\ =&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}\delta f+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\delta\left(\frac{\partial f}{\partial t}\right)+\frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\delta\left(\frac{\partial f}{\partial x}\right) \right]\\ =&\iint \mathrm dt\mathrm dx\left[\frac{\partial L}{\partial f}- \frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right) -\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right) \right]\delta f\\ \end{aligned}

所以泛函取极值的必要条件即

δSδf=Lft(L(ft))x(L(fx))=0(1.39)\frac{\delta S}{\delta f}=\frac{\partial L}{\partial f} -\frac{\partial}{\partial t}\left(\frac{\partial L}{\partial \left(\frac{\partial f}{\partial t}\right)}\right) -\frac{\partial}{\partial x}\left( \frac{\partial L}{\partial \left(\frac{\partial f}{\partial x}\right)}\right)=0\tag{1.39}

习题

1.5 考虑一条补课拉伸,质量均匀的柔软喜神,长为 ll ,质量为 mm ,细绳两端点悬挂于相同高度,水平距离为 a(a<l)a(a<l) .

(1) 选择合适的坐标,求细绳总的重力势能 VV 作为细绳形状的泛函.

(2)求细绳重力势能取极值时,细绳形状所满足的欧拉-拉格朗日方程.

proofproof

(1) 以细绳的一个端点作为原点,建立坐标系,细绳总的重力势能 VV 可以写成

V=0adx1+y2lmgy=0adxmgly1+y2V=\int_0^a \mathrm dx \frac{\sqrt{1+y'^2}}{l} mgy=\int_0^a \mathrm dx\frac{mg}{l}y\sqrt{1+y'^2}

(2)做变分

δV=0adxmgl(δy1+y2+yy1+y2δy)0adxmgly2yy+1(1+y2)3/2δy\begin{aligned} \delta V=&\int_{0}^a \mathrm dx \frac{mg}{l}\left(\delta y\sqrt{1+y'^2}+\frac{yy'}{\sqrt{1+y'^2}}\delta y' \right)\\ \simeq&\int_{0}^a \mathrm dx \frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}\delta y \end{aligned}

因此 δV=0\delta V=0,要求

δVδy=mgly2yy+1(1+y2)3/2=0-\frac{\delta V}{\delta y}=-\frac{mg}l\frac{y'^2-yy''+1}{\left( 1+y'^2 \right )^{3/2}}=0

即细绳形状满足微分方程

y2yy+1=0y^2-yy''+1=0

Chapter 2 位形空间

2.1 位形与时间演化

2.1.1 位形

位形(configuration)即粒子系统中各个粒子的空间位置,或者更一般的物理系统在空间中的形状、分布.位形的概念可以推广至连续系统和非机械系统.

2.1.2 位形空间与流形

​ 系统所有可能位形的集合,就构成位形空间(configuration space).位形空间中的一点,即代表系统的一种可能的位形.

​ 一般来说,物理系统的位形空间一般不是平坦的线性空间(矢量空间).例如,球面是一个二维空间,但显然不是平坦的.但是,球面局部的一小块,看上去又和二维平面很想,数学上对这种一般的空间的描述,即所谓流形(manifold)理论.

2.1.3 世界线

​ 随着时间的演化,位形空间中的点在这个空间中也扫出一条连续的曲线,有时被称作时间线(world line).

2.2 广义坐标

2.2.1 广义坐标的概念

​ 对位形空间的参数化即广义坐标(generalized coordinates),其是任意一组都能够唯一确定系统某个位形的独立参数.

位置位形普通空间  位形空间普通坐标  广义坐标\begin{aligned} 位置\quad &\to \quad 位形\\ 普通空间 \ &\to\ 位形空间\\ 普通坐标 \ &\to\ 广义坐标 \end{aligned}

Example 2.1 圆环上粒子的位形

​ 如图所示,粒子在固定圆环上无摩擦的自由滑动,粒子在圆环上的角度唯一决定粒子的位置,所以系统具有一个独立的广义坐标即 θ\theta .这个系统的位形空间就是圆周,通常记作 S1\mathbf{S}^1 .

Example 2.2 单摆的位形

(a)一个独立广义坐标 θ\theta ,位形空间为一维圆周 S1\mathbf{S}^1 .

(b)两个独立广义坐标 xxθ\theta ,位形空间为二维柱面 R1×S1\mathrm{R}^1\times \mathrm{S}^1 .

(c)球坐标 {θ,ϕ}\{\theta,\phi\} ,位形空间为二维球面 S2\mathrm{S}^2 .

Example 2.3 刚性杆连接两个粒子的位形

​ 系统具有 3 个独立的广义坐标 {x1,y1,θ}\{x_1,y_1,\theta\} ,位形空间为 R2×S1\mathbf{R}^2\times\mathbf{S}^1 .

Example 2.4 双摆的位移

​ 两个杆的摆角唯一决定了双摆的位形.两个杆的白交 θ1\theta_1θ2\theta_2 各自都具有 2π2\pi 的周期性,所以双摆的位形空间是 S1×S1T2\mathbf{S}^1\times \mathbf{S}^1\equiv \mathbf{T}^2 ,其代表二维环面.

​ 物理系统 ss 个独立的广义坐标

{q1,,qs}qa,a=1,2,,s(2.1)\boxed{\{q^1,\cdots,q^s\}\equiv q^a,\quad a=1,2,\cdots,s}\tag{2.1}

代表位形空间的一点,即代表系统某个唯一确定的位形,因此,

位形空间的位数=独立广义坐标的个数(2.2)位形空间的位数=独立广义坐标的个数 \tag{2.2}

2.2.2 广义坐标的变换

​ 现在假设两个广义坐标 {q}\{q\}{q~}\{\tilde q\} ,描述同一个位形空间,考虑此位形空间中的任意点 PP(给定的位形),对应 {q}\{q\} 坐标的数值记作 qP\left. q\right |_P{q~}\{\tilde{q}\} 坐标的数值记作 q~P\left .\tilde{q}\right |_P ,两组坐标的数值满足函数关系

q~aP=fa(t,qaP),a=1,2,,s(2.3)\left. \tilde {q}^a\right|_P=f^a(t,\left . q^a\right |_P),\quad a=1,2,\cdots,s \tag{2.3}

习惯上用 q~a\tilde{q}^a 本身作为变换的函数名,即

qaq~a=q~a(t,qa),a=1,2,,s(2.4)\boxed{q^a\to \tilde q^a=\tilde q^a(t,q^a)},\quad a=1,2,\cdots,s\tag{2.4}

这种广义坐标之间的变换也叫做点变换(point transformation).我们要求式(2.4)是可逆的,即存在

q~aqa=qa(t,q~a)(2.5)\tilde q^a\to q^a=q^a(t,\tilde q^a)\tag{2.5}

也就是说 {q}\{q\}{q~a}\{\tilde q^a\} 是一一对应的.可逆性要求坐标变换的雅可比行列式非零,即

det(q~aqa)0(2.6)\det(\frac{\partial \tilde q^a}{\partial q^a})\neq 0\tag{2.6}

注意 q~bqa\frac {\partial \tilde q^b}{\partial q^a}qaq~b\frac{\partial q^a}{\partial \tilde q^b} 满足

b=1sqaq~bq~bqc=δac(2.7)\sum_{b=1}^s\frac{\partial q^a}{\partial \tilde q^b}\frac{\partial \tilde q^b}{\partial q^c}=\delta_{ac}\tag{2.7}

2.3 速度、速度相空间

2.3.1 速度相空间

​ 对于一般的物理系统,从广义坐标 {q}\{q\} 出发,广义速度(generalized velocity)定义为广义坐标的时间导数

va=dqa(t)dtq˙a,a=1,2,,s(2.8)\boxed{v^a=\frac{\mathrm d q^a(t)}{\mathrm dt}\equiv \dot{q}^a},\quad a=1,2,\cdots,s\tag{2.8}

​ 物理系统所有可能状态的集合,即状态空间,也被称为相空间(phase space).“坐标”和"速度“构成的状态空间,被称为速度相空间(velocity space),速度相空间中的一点 {q,q˙}\{q,\dot{q}\} 代表系统的一种可能的状态,因此

相空间的位数=唯一确定系统演化的独立参数的个数(2.9)相空间的位数=唯一确定系统演化的独立参数的个数\tag{2.9}

对于点粒子系统,相空间的位数总是偶数维的,这是因为点粒子系统的运动方程总是需要偶数个初始条件.

2.3.2 广义坐标的变换所诱导的广义速度变换

​ 在式(2.4)的坐标变换下,广义速度的变换为

q~˙adq~adt=b=1sq~aqbq˙b+q~t~(2.10)\dot{\tilde q}^a\equiv\frac{\mathrm d \tilde q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial \tilde q^a}{\partial q^b}\dot q^b+\frac{\partial \tilde q}{\partial \tilde t}\tag{2.10}

其中 q~aqb\frac{\partial \tilde q^a}{\partial q^b} 即坐标变换的雅可比矩阵,逆变换即

qadqadt=b=1sqaq~bq~˙b+qt~(2.11){ q}^a\equiv\frac{\mathrm d q^a}{\mathrm dt}=\sum_{b=1}^s \frac{\partial q^a}{\partial \tilde q^b}\dot {\tilde q}^b+\frac{\partial q}{\partial \tilde t}\tag{2.11}

其中 qaq~b\frac{\partial q^a}{\partial\tilde q^b}q~aqb\frac{\partial \tilde q^a}{\partial q^b} 的逆.雅可比行列式 qaq~b\frac{\partial q^a}{\partial \tilde q^b}q~aqb\frac{\partial\tilde q^a}{\partial q^b} 都只是广义坐标的函数,因此还可以得到

q~a˙q˙b=q~aqb,qa˙q~b˙=qaq~b(2.12)\frac{\partial \dot {\tilde q^a}}{\partial \dot q^b}=\frac{\partial \tilde q^a}{\partial q^b},\quad\frac{\partial \dot {q^a}}{\partial \dot{\tilde q^b}}=\frac{\partial q^a}{\partial \tilde q^b}\tag{2.12}

即广义速度之间的偏导关系等于广义坐标之间的偏导关系.数学上,这正是广义坐标作为逆变矢量在广义坐标变换下的变化关系.

2.4 约束

2.4.1 约束的概念

​ 对系统所能达到的状态(即广义坐标和广义速度)所强加的运动学限制条件即约束(constraint).这里”运动学“表明约束和相互作用,即和动力学(加速度)没有关系.

​ 约束是对系统状态的限制,也就是对”坐标“和”速度“的限制.当不存在约束时,系统的广义坐标记为 ${q^1,\cdots,q^m} $,则约束的一般数学表达式为

ϕ(t,q1,,qm,q˙1,,q˙m)=0(2.13)\phi(t,q^1,\cdots,q^m,\dot{q}^1,\cdots,\dot{q}^m)=0\tag{2.13}

2.4.2 约束的分类

​ 定常约束(seleronomous constraint)和非定常约束(rheonomous constraint).约束方程不显含时间,即

ϕ(q1,,qm,q˙1,,q˙m)=0(2.14)\phi(q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0\tag{2.14}

为定常约束.需要强调的是,定常约束在另一个有相对运动的参考系中看,则表现为一个非定常约束.但反过来,不是所有的非定常约束都可以通过改变参考系变换为定常约束.


​ 约束最重要的一种分类是所谓的完整约束和非完整约束.约束方程具有形式

ϕ(t,q1,,qm)=0(2.15)\phi(t,q^1,\cdots,q^m)=0\tag{2.15}

则被称为完整约束(holonomic constraint),也叫几何约束,完整约束是对广义坐标之间的约束关系,是对系统”可能位形“的直接限制.完整约束表面有些广义坐标其实是不独立的,可以直接用其他(真正独立的)广义坐标表示出来.如果一个系统的所有约束皆为完整约束,则该系统称为完整系统(holonomic system).记无约束时系统的广义坐标为 {q1,,qm}\{q^1,\cdots,q^m\} ,若存在且只存在 kk 个独立的完整约束

ϕα(t,q1,,qm)=0,α=1,,k(2.16)\phi_\alpha(t,q_1,\cdots,q^m)=0,\quad \alpha=1,\cdots,k\tag{2.16}

则系统独立的广义坐标数为

s=mk(2.17)s=m-k\tag{2.17}

​ 所有不是完整约束的约束——亦即约束方程无法写成式(2.15)形式的约束即是非完整约束(nonholonomic constraint).非完整约束中最重要的一类式不可积微分约束(non-integrable differential constraints).所谓微分约束,即约束方程形如

ϕ(t,q1,,qm,q˙1,,q˙m)=0(2.18)\phi(t,q^1,\cdots,q^m,\dot q^1,\cdots,\dot q^m)=0 \tag{2.18}

如果一个系统含有未完整约束,即称为非完整系统(non-holonomic system).

Example 2.10 非完整约束:独轮车

​ 独轮车(unicycle)是最简单的非完整约束的例子。如图所示,半径为 RR 的轮子,在水平面上做纯滚动(即轮子不打滑)。简单起见,假定轮面和水平面垂直,可用 {x,y,θ,ϕ}\{x,y,\theta,\phi\}这 4 个参数描述此系统的位形。满足 2 个约束方程

ϕ1x˙Rϕ˙cosθ=0,ϕ2y˙Rϕ˙sinθ=0(2.19)\phi_1\equiv\dot x-R\dot \phi \cos\theta=0,\quad\phi_2\equiv\dot y-R\dot \phi \sin\theta=0\tag{2.19}

这是关于 {x,y,θ,ϕ}\{x,y,\theta,\phi\} 这 4 个广义坐标的 2 个微分约束。现在证明,式(2.19)中的两个微分约束是不可积的。首先,式(2.19)可以写成

dxRcosθdϕ=0,dyRsinθdϕ=0(2.20)\mathrm dx-R\cos \theta\mathrm d\phi=0,\quad \mathrm dy-R\sin\theta \mathrm d\phi=0\tag{2.20}

数学上可以证明,微分式 F1dx1+F2dx2+F3dx3F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3 乘以某个积分因子 λ\lambda 后是全微分,亦即存在 Φ\Phi 使得 dΦ=λ(F1dx1+F2dx2+F3dx3)\mathrm d\Phi=\lambda(F_1\mathrm dx^1+F_2\mathrm dx^2+F_3\mathrm dx^3) 的充分必要条件是

F1(F2x3F3x2)+F2(F3x1F1x3)+F3(F1x2F2x1)=0(2.21)F_1\left(\frac{\partial F_2}{\partial x^3}-\frac{\partial F_3}{\partial x^2}\right)+ F_2\left(\frac{\partial F_3}{\partial x^1}-\frac{\partial F_1}{\partial x^3}\right)+ F_3\left(\frac{\partial F_1}{\partial x^2}-\frac{\partial F_2}{\partial x^1}\right) =0\tag{2.21}

式(2.20)中的两个微分式都不满足,即左边不是全微分。

Example 2.11 非完整约束:两轮车

​ 两轮车的简化模型如图所示,轮子半径为 RR ,两轮心距离为 ll ,轮子在水平面上做纯滚动,后轮方向固定,通过前轮转向。简单起见,假设轮面和水平面垂直。为了描述此系统的位形,首先可以确定后轮的位置 {x,y}\{x,y\} ,以及后轮的偏向角 ϕ\phi 和后轮的自转角 αB\alpha _B。这是,前轮的位置也自然确定了,由几何关系得到

xA=xlsinϕ,yA=y+lcosϕ(2.22)x_A=x-l\sin\phi,\quad y_A=y+l\cos\phi\tag{2.22}

能够调节的还有前轮的转向角 θ\theta 和自转角 αA\alpha _A 。所以,系统的位形需要用 66 个参数 {x,y,θ,ϕ,αA,αB}\{x,y,\theta,\phi,\alpha_A,\alpha_B\} 描述。注意当前轮的转向角 θ\theta 固定时,前后轮的运动轨迹是同心圆,圆心 OO 则是前后轮面垂线的交点。和独轮车一样,列出前后轮的约束。对于后轮

x˙=Rα˙Bsinϕ,y˙=Rα˙Bcosϕ(2.23)\dot x=-R\dot \alpha_B\sin\phi,\quad \dot y=R\dot \alpha _B\cos\phi\tag{2.23}

对于前轮

x˙lϕ˙cosϕ=Rα˙Asin(ϕ+θ),y˙lϕ˙sinϕ=Rα˙Acos(ϕ+θ)(2.24)\dot x-l\dot \phi\cos\phi=-R\dot \alpha _A\sin(\phi+\theta),\quad \dot y-l\dot \phi\sin\phi=R\dot\alpha_A\cos(\phi+\theta)\tag{2.24}

由上式重新组合,也可以得到等价的、几何意义更加明显的约束方程

Rα˙Acosθ=Rα˙B,Rα˙A=lcotθϕ˙(2.25)R\dot \alpha_A\cos\theta=R\dot \alpha_B,\quad R\dot\alpha_A=l\cot \theta\dot \phi\tag{2.25}

总之,对于两轮车,6 个广义坐标满足 4 个非完整约束。

2.5 自由度

​ 完整约束直接消除了广义坐标之间的独立性,表明广义坐标之间由约束关系。这种关系即体现在广义坐标之间,也体现在广义坐标的“变分”之间。由约束方程 ϕ(t,q)=0\phi(t,\mathbf q)=0 变分得到

δϕ=a=1mϕqaδqa=0(2.26)\delta \phi=\sum_{a=1}^m\frac{\partial \phi}{\partial q^a}\delta q^a=0\tag{2.26}

其表面广义坐标不是独立的,满足上面的线性关系。式(2.26)具有非常直观的几何意义,如图所示,一个完整约束可视为位形空间中的一张曲面,系统的位形限制在这张曲面上,因此广义坐标也必然限制在约束面上。式(2.32)中的 ϕqa\frac{\partial \phi}{\partial q^a} 即约束面在位形空间中的梯度,即约束面的法向 ϕ\nabla\phi,式(2.32)正表明广义坐标变分 δq\delta q 与约束面的法向 ϕ\nabla \phi 正交,即切于约束面。

​ 对于完整系统,一个重要的特征量即独立广义坐标的数目,且每一个完整约束降低一个独立广义坐标变分的数目。而对于非完整约束,约束本身并不能降低独立广义坐标的数目,而只能降低独立广义坐标“变分”的数目。可见,相较于独立广义坐标数目本身,独立广义坐标“变分”的数目更能反映出系统的性质,这就直接导致了自由度(degrees of freedom)的概念。简言之,自由度等于独立广义坐标变分的数目。需要强调的是,自由度是系统的内禀性质,与具体广义坐标的选取无关。

​ 一个完整约束同时减少一个独立坐标和独立速度分量,一个非完整约束之间少一个独立速度分量。对于非完整约束,广义坐标的个数通常大于真正的自由度。亦即,我们需要额外的变量来参数化其位形,这正体现了非完整系统路径依赖的特性。总之,

完整系统:自由度=广义坐标个数非完整系统:自由度<广义坐标个数\begin{aligned} 完整系统:自由度&=广义坐标个数\\ 非完整系统:自由度 &\lt 广义坐标个数 \end{aligned}

物理系统的时间演化由微分方程描述,从微分方程定解的角度,问题可以归结为我们需要知道多少个独立的初始条件,才能确定一组定解。或者说,我们由多少个独立参数,可以用以调节从而得到系统的不同演化。这一问题也被称作柯西初值问题(Cauchy initial value problem)。对于自然界常见的系统,约定每 1 个自由度的演化由其广义坐标和广义速度(即状态)的初值,即 2 个参数决定。在这个意义上,自由度可以等价地定义为

自由度=12唯一确定系统状态的独立参数个数=12唯一确定系统演化的初始条件的个数=12相空间的位数(2.34)\begin{aligned} 自由度 &=\frac 12\cdot唯一确定系统状态的独立参数个数\\ &=\frac 12\cdot唯一确定系统演化的初始条件的个数\\ &=\frac 12 \cdot 相空间的位数 \end{aligned} \tag{2.34}

对于点粒子系统,相空间的维数总是偶数,于是保证了自由度都是整数。

Chapter 3 相对论时空观

​ 力学研究物理系统的时间演化。物理系统的韵达规律总是在某个时空背景上加以描述,所以力学的首要问题即是时空观(view on space and time),即对于时间和空间的基本观念。

3.1 时空的基本概念

3.1.1 时空

​ 时间的一瞬和空间的一点的联合就给定了一个“时空点”,记作 pp 。对于任何一个时空点 pp ,我们都可以用 44 个实数(cc 为光速)

{ct,x,y,z}{x0,x1,x2,x3}{xμ},μ=0,1,2,3(3.1)\{ct,x,y,z\}\equiv \{x^0,x^1,x^2,x^3\} \equiv\{x^{\mu}\},\quad\mu=0,1,2,3 \tag{3.1}

来对其参数化。全体时空点的集合即时空(spacetime)。

3.2 度规

3.2.1 度规

​ 记空间坐标为 {qa}\{q^a\},则无穷小距离的平方可以表示成坐标微分 {dqa}\{\mathrm d q^a\} 的二次型。这个无穷小距离的平方被称作线元(line element),通常记作 ds2\mathrm d s^2 ,写成矩阵的形式即

ds2=(dq1dqs)(g11g1sgs1gss)(dq1dqs)(3.2)\mathrm d s^2= \begin{pmatrix} \mathrm dq^1 & \cdots & \mathrm dq^s \end{pmatrix} \begin{pmatrix} g_{11}& \cdots & g_{1s} \\ \vdots & \ddots & \vdots \\ g_{s1} & \cdots & g_{ss} \end{pmatrix} \begin{pmatrix} \mathrm dq^1\\ \vdots \\ \mathrm d q^s \end{pmatrix} \tag {3.2}

这里由二次型的系数构成的对称矩阵 gabg_{ab} 被称作度规(metric)。

3.2.2 一些典型空间的度规

​ 2 维欧氏空间的线元可以写成

ds2=i=12j=12δijdxidxj,δi,j=(1001),i,j=1,2(3.3)\mathrm ds^2=\sum_{i=1}^2\sum_{j=1}^2 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}= \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} } ,\quad i,j=1,2 \tag{3.3}

​ 极坐标 {r,ϕ}\{r,\phi\}

ds2=i=12j=12gijdxidxj,gi,j=(100r2),i,j=r,ϕ(3.4)\mathrm d s^2=\sum_{i=1}^2\sum_{j=1}^2 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}= \begin{pmatrix} 1 & 0\\ 0 & r^2 \end{pmatrix}}, \quad i,j=r,\phi \tag{3.4}

​ 3 维欧氏空间

ds2=i=13j=13δijdxidxj,δi,j=(100010001),i,j=1,2,3(3.5)\mathrm ds^2=\sum_{i=1}^3\sum_{j=1}^3 \delta_{ij}\mathrm dx^i \mathrm dx^j,\quad {\delta_{i,j}= \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix} } ,\quad i,j=1,2,3 \tag{3.5}

​ 球坐标 {r,ϕ,θ}\{r,\phi,\theta\}

ds2=i=13j=13gijdxidxj,gi,j=(1000r2000r2sin2θ),i,j=r,ϕ,θ(3.6)\mathrm d s^2=\sum_{i=1}^3\sum_{j=1}^3 g_{ij}\mathrm dx^i \mathrm d x^j,\quad{ g_{i,j}= \begin{pmatrix} 1 & 0 & 0\\ 0 & r^2 & 0\\ 0 & 0 & r^2\sin^2 \theta \end{pmatrix}}, \quad i,j=r,\phi,\theta \tag{3.6}

3.2.3 度规的一般定义

​ 当选取某个做坐标 {qa}\{q^a\} 时,空间中的线元总是可以表达成坐标微分 {dqa}\{\mathrm d q^a\} 的二次型:

ds2=a=1Db=1Dgabdqadqb(3.7)\mathrm d s^2=\sum_{a=1}^D\sum_{b=1}^D g_{ab}\mathrm dq^a\mathrm dq^b\tag{3.7}

这里 DD 表示空间的维数;gabg_{ab} 即度规,是非退化的即 detgab0\det g_{ab} \neq 0 ,且是对称的 gab=gbag_{ab}=g_{ba} 。采用爱因斯坦求和约定(Einstein summation convention),线元通常写成

ds2=gabdqadqb(3.8)\boxed{\mathrm d s^2=g_{ab}\mathrm dq^a\mathrm d q^b} \tag{3.8}

规定逆度规(inverse metric)

gab:=(g1)ab(3.9)\boxed{g^{ab}:=(g^{-1})_{ab}}\tag{3.9}

3.2.4 时空的度规

​ 爱因斯坦狭义相对论的时空背景是所谓闵可夫斯基时空(Minkowski spacetime),简称闵氏时空,取直角坐标

{xμ}={x0,x1,x2,x3}={ct,x,y,z}(3.10)\{x^\mu\}=\{x^0,x^1,x^2,x^3\}=\{ct,x,y,z\} \tag{3.10}

闵氏时空的线元为

ds2=c2(dt)2+(dx)2+(dy)2+(dz)2ημνdxμdxν(3.11)\mathrm d s^2=-c^2(\mathrm dt)^2+(\mathrm dx)^2+(\mathrm dy)^2+(\mathrm dz)^2\equiv\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu\tag{3.11}

因此闵氏时空的度规和逆度规分别为

ημν=(1000010000100001),ημν=(1000010000100001)(3.12)\eta_{\mu\nu}= \begin{pmatrix} -1 & 0 & 0 &0\\ 0 & 1 & 0 &0\\ 0 & 0 & 1 & 0\\ 0 & 0 &0 & 1 \end{pmatrix},\quad \eta^{\mu\nu}= \begin{pmatrix} -1 & 0 & 0 &0\\ 0 & 1 & 0 &0\\ 0 & 0 & 1 & 0\\ 0 & 0 &0 & 1 \end{pmatrix}\tag{3.12}

​ 对于一个一般的时空北京,度规可以写成

ds2=gμνdxμdxν(3.24)\mathrm ds^2=g_{\mu\nu}\mathrm d x^\mu\mathrm dx^\nu \tag{3.24}

3.2.5 逆变和协变

​ 在矢量或张量上方的指标被称为上标(upper index)或逆变指标(contravariant index),在下方的指标被称为下标(lower index)或协变指标(covariant index)。相应地,带上标的矢量(例如广义速度 qa˙\dot{q^a})被称为逆变矢量(contravariant vector),带下标的矢量(例如梯度 af\nabla _a f)被称为协变矢量(covariant vector)。

Chapter 4 最小作用量原理

4.2 作用量

作用量(action)

S[q]=t1t2dtL(t,q,q˙)(4.1)S[q]=\int_{t_1}^{t_2}\mathrm dtL(t,q,\dot{q}) \tag{4.1}

最小作用量原理(principle of least action)

δS=0(4.2)\delta S =0\tag{4.2}

4.2.2 广义动量

​ 物理系统某个广义坐标 qaq^a 对于的广义动量(generalized momentum)定义为

pa:=Lqa˙Lva,a=1,,s(4.3)\boxed{p_a:=\frac{\partial L}{\partial \dot{q^a}}\equiv\frac{\partial L}{\partial v^a}},\quad a=1,\cdots,s\tag{4.3}

广义坐标 qaq^a 及其对应的广义动量 pap_a 构成一对共轭变量 {qa,pa}\{q^a,p_a\} ,因此式(4.3)定义的广义动量又被称为共轭动量(conjugate momentum)或正则动量(canonical momentum)。

4.3 自由粒子

4.3.1 4 维形式

​ 自由粒子的作用量最简单的取法即时间线的长度

S=mcds=mcημνdxμdxν(4.4)S=-mc\int|\mathrm ds|=-mc\int \sqrt{-\eta_{\mu\nu}\mathrm dx^\mu\mathrm dx^\nu}\tag{4.4}

​ 原则上可以用任一单调变化的参数来参数化世界线。最简单和自然的参数化即取固有时 τ\tau

ds2=ημνdxμdxνc2dτ2(4.5)\mathrm ds^2=\eta_{\mu\nu}\mathrm dx^{\mu}\mathrm dx^{\nu}\equiv -c^2\mathrm d \tau^2\tag{4.5}

因此自由粒子的作用量式(4.4)还可以写成

S=mcdτημνdxμdτdxνdτ(4.6)S=-mc\int \mathrm d\tau\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}} \tag{4.6}

粒子的时空坐标 xμx^\mu 随固有时 τ\tau 的变化率被称为 4-速度(4-velocity)

uμ:=dxμ(τ)dτ(4.7)u^\mu:=\frac{\mathrm dx^\mu(\tau)}{\mathrm d\tau} \tag{4.7}

其实 4 维时空中的矢量。由式(4.5)

uμuμημνdxμdτdxνdτ=c2(4.8)u_\mu u^\mu\equiv\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm dx^\nu}{\mathrm d\tau}=-c^2 \tag{4.8}

即粒子的 4-速度 uμu^\mu 的模方是常数 c2-c^2

​ 将式(4.6)对 xμx^\mu 求变分,并利用式(4.8),得到

δS=mcdτδημνdxμdτdxνdτ=mdτημνδ(dxμdτ)dxνdτmdτημνd2xνdτ2δxμ(4.8)\begin{aligned} \delta S&=-mc\int \mathrm d\tau\delta \sqrt{-\eta_{\mu\nu}\frac{\mathrm d x^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}=m\int\mathrm d\tau \eta_{\mu\nu}\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\\ &\simeq -m\int\mathrm d\tau \eta_{\mu\nu} \frac{\mathrm d^2 x^\nu}{\mathrm d\tau^2}\delta x^\mu \end{aligned} \tag{4.8}

所以粒子的自由运动方程为

d2xνdτ2=0(4.9)\frac{\mathrm d^2 x^\nu}{\mathrm d \tau^2}=0 \tag{4.9}

​ 引入 4-速度后,自由粒子的作用量式(4.6)可以写成 S=dτLS=\int \mathrm d\tau L ,这里 L=mcημνuμuνL=-mc\sqrt{-\eta_{\mu\nu}u^\mu u^\nu} ,粒子的 4-动量为

pμ:=Luμ=uμ(mcηρσuρuσ)=muμ(4.10)p_\mu:=\frac{\partial L}{\partial u^\mu}=\frac{\partial}{\partial u^\mu}(-mc\sqrt{-\eta_{\rho\sigma}u^\rho u^\sigma})=mu_\mu\tag{4.10}

4.3.2 3 维形式

​ 式(4.4)可以写成

S=mcc2(dt)2δijdxidxj=mc2dt11c2δijdxidtdxjdt(4.11)S=-mc\int\sqrt{c^2(\mathrm dt)^2-\delta_{ij}\mathrm dx^i\mathrm dx^j}=-mc^2\int \mathrm dt\sqrt{1-\frac{1}{c^2}\delta_{ij}\frac{\mathrm dx^i}{\mathrm d t}\frac{\mathrm dx^j}{\mathrm dt}} \tag{4.11}

其中出现了粒子空间坐标 {xi}\{x^i\} 随着时间参数 tt 的变化率

vi:=dxidt,i=1,2,3(4.12)v^i:=\frac{\mathrm dx^i}{\mathrm dt},\quad i=1,2,3 \tag{4.12}

即通常所说的”速度“,也被称作 3-速度(3-velocity),为 3 维空间中的矢量。于是作用量式(4.4)称为

S=dtL,L=mc21v2c2(4.13)S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}} \tag{4.13}

其中 v2δijvivjv^2\equiv \delta_{ij}v^iv^j,式(4.13)就是闵氏时空中自由粒子作用量的 3 维形式。这里自然地出现了著名的洛伦兹因子 (Lorentz factor)

dtdτ=11v2c2γ(4.14)\frac{\mathrm dt}{\mathrm d\tau}=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}\equiv\gamma \tag{4.14}

​ 同时可以得到 3-动量

piLvi=vi(mc21v2c2)=mvi1v2c2,i=1,2,3(4.15)p_i\equiv\frac{\partial L}{\partial v^i}=\frac{\partial}{\partial v^i}\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}\right)=\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.15},\quad i=1,2,3

这里 vi=δijvjv_i=\delta_{ij} v^j。利用式(4.14)及 3-速度的定义, 3-动力还可以写成

pi=mdxidtdtdτ=mdxidτmui,i=1,2,3(4.16)p_i=m\frac{\mathrm dx_i}{\mathrm dt}\frac{\mathrm dt}{\mathrm d\tau}=m\frac{\mathrm dx_i}{\mathrm d\tau}\equiv mu_i,\quad i=1,2,3 \tag{4.16}

可见 3-动量对应空间坐标对于固有时 τ\tau 的变化率(4-速度的空间分量)。牛顿力学中的动量 mvimv_i 只是严格的 3-动量在非相对论极限下的近似。

​ 对于时间分量,定义

E:=cp0=mcu0=mc2dtdτ=mc21v2c2(4.17)E:=cp^0=mcu^0=mc^2\frac{\mathrm dt}{\mathrm d\tau}=-\frac{mc^2}{\sqrt{1-\frac{v^2}{c^2}}}\tag{4.17}

为粒子的能量。于是 4-动量的模方可以分解为

pμpμ=(p0)2+δijpipjE2c2+p2(4.18)p_\mu p^\mu=-(p^0)^2+\delta_{ij}p^ip^j\equiv -\frac{E^2}{c^2}+p^2\tag{4.18}

这里 p2=δijpipjp^2=\delta_{ij}p^ip^j。而由式(4.8)得,4-动量的模方是常数

pμpμ=m2uμuμ=m2c2(4.19)p_\mu p^\mu=m^2u_\mu u^\mu=-m^2c^2\tag{4.19}

即给出

E2=p2c2+m2c4(4.20)E^2=p^2c^2+m^2c^4\tag{4.20}

这就是著名的爱因斯坦能量-动量关系(energy-momentum relation)。

4.4 外场中的粒子

4.4.1 标量场

​ 考虑闵氏时空标量场中的粒子。标量场对粒子的影响可以有各种方式,我们考虑最简单的情形,即使得线元长度发生变化 $|\mathrm ds|\rightarrow e^\Phi|\mathrm ds| $,因此作用量为

S=mceΦds=mcdτeΦuμuμ(4.21)S=-mc\int e^\Phi|\mathrm ds|=-mc\int \mathrm d\tau e^\Phi\sqrt{-u_\mu u^\mu} \tag{4.21}

其中 Φ=Φ(t,x)Φ(x)\Phi=\Phi(t,x)\equiv \Phi(x) 是无量纲的标量场,uμu^\mu 为 4-速度式。对作用量式(4.21)对时空坐标 xμx^\mu 求变分得到运动方程

d2xμdτ2+Φxνxντdxμdτ+c2Φxμ=0,μ=0,1,2,3(4.22)\frac{\mathrm d^2x_\mu}{\mathrm d\tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx_\mu}{\mathrm d\tau}+c^2\frac{\partial \Phi}{\partial x^\mu}=0,\quad \mu=0,1,2,3\tag{4.22}

推导

δS=mcdτδ(eΦημνdxμdτdxνdτ)=mdτ[c2eΦΦxμδxμ+eΦδ(dxμdτ)dxνdτ]mdτ[ddτ(eΦdxνdτ)+c2eΦΦxμ]δxμ=mdτeΦ(d2xμdτ2+Φxνxντdxμdτ+c2dΦxμ)δxμ\begin{aligned} \delta S&=-mc\int\mathrm d\tau \delta\left(e^\Phi\sqrt{-\eta_{\mu\nu}\frac{\mathrm dx^\mu}{\mathrm d\tau}\frac{\mathrm d x^\nu}{\mathrm d\tau}}\right)\\ &=m\int\mathrm d\tau\left[-c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\delta x^\mu +e^\Phi\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau}\right)\frac{\mathrm d x^\nu}{\mathrm d\tau}\right]\\ &\simeq -m\int \mathrm d\tau\left[\frac{\mathrm d}{\mathrm d\tau}\left(e^\Phi\frac{\mathrm d x^\nu}{\mathrm d\tau} \right)+ c^2e^\Phi\frac{\partial \Phi}{\partial x^\mu}\right]\delta x^\mu\\ &=-m\int\mathrm d\tau e^\Phi\left(\frac{\mathrm d^2 x^\mu}{\mathrm d \tau^2}+\frac{\partial \Phi}{\partial x^\nu}\frac{\partial x^\nu}{\partial \tau}\frac{\mathrm dx^\mu}{\mathrm d\tau}+c^2\frac{\mathrm d\Phi}{\partial x^\mu } \right)\delta x^\mu \end{aligned}

类似地,作用量式(4.38)的 3 维形式为

S=mc2dteΦ1v2c2(4.23)S=-mc^2\int \mathrm dte^\Phi\sqrt{1-\frac{v^2}{c^2}}\tag{4.23}

将其对空间坐标 xix^i 变分即得到运动方程的 3 维形式

pi˙+Φ˙pi+mc21v2c2Φxi=0,i=1,2,3(4.24)\dot{p_i}+\dot{\Phi}p_i+mc^2\sqrt{1-\frac{v^2}{c^2}}\frac{\partial \Phi}{\partial x^i}=0,\quad i=1,2,3\tag{4.24}

​ 在有外场存在的情况下,我们同时考虑“低速”和“弱场”的极限,即

vc1,ΦVmc21(4.25)\frac{|v|}{c}\ll1,\quad|\Phi|\equiv\frac{|V|}{mc^2}\ll1\tag{4.25}

其中 VV 具有能量量纲。因为 Vmc2|V|\ll mc^2 的意义是与外场相互作用的能量远远小于粒子的静止能量 mc2mc^2 。因此上面的极限也可以统称为非相对论极限。在非相对论极限下,运动方程式(4.24)展开并保留至速度 vvVV 的领头阶 为

mxi¨=Vxi(4.26)m\ddot{x_i}=-\frac{\partial V}{\partial x^i} \tag{4.26}

其中右边 Vxi-\frac{\partial V}{\partial x^i}VV 的空间梯度,正是牛顿力学中保守力的形式。这表明在非相对论极限下, $V $ 具有牛顿力学中势能的意义。另一方面,作用量的 3 维形式(4.23)也可展开并保留领头阶,得到

S=mc2dteVmc21v2c2=mc2dt(1+Vmc2+)(112v2c2+)=dtmc2+dt(12mv2V)+(4.27)\begin{aligned} S&=-mc^2\int \mathrm dt e^{\frac{V}{mc^2}}\sqrt{1-\frac{v^2}{c^2}}=-mc^2\int\mathrm dt(1+\frac{V}{mc^2}+\cdots)(1-\frac{1}{2}\frac{v^2}{c^2}+\cdots)\\ &=-\int \mathrm dt mc^2+\int \mathrm dt\left (\frac12mv^2-V\right)+ \cdots \end{aligned} \tag{4.27}

除去常数项,在非相对论极限下,拉格朗日量在与速度和外场有关的领头阶具有“动能减去势能”的形式:

L=12mv2VTV(4.28)L=\frac{1}{2}mv^2-V\equiv T-V \tag{4.28}

其中 T=12mv2T=\frac 12 mv^2 即牛顿力学的动能,VV 在非相对论极限下对于牛顿力学的势能。从展开的过程可以看出,这里“减号”的来源正是闵氏时空度规中时间和空间部分的符号差异。

4.4.2 电磁场

​ 接下来考虑粒子与 4 维矢量场 AμA^\mu 的相互作用,最熟悉的矢量场即电磁场。考虑闵氏时空,作用量必须是洛伦兹标量。因此,问题转化为如何用矢量场和粒子的世界线来构造一个标量,最简单的方式就是矢量场与粒子 4-速度的内积 AμuμA_\mu u^\mu ,将这个标量沿着粒子的世界线积分,自然仍然是一个标量。于是,矢量场对粒子的作用量贡献为

dτAμuμ=dτAμdxμdτ=Aμdxμ(4.29)\int \mathrm d\tau A_\mu u^\mu=\int \mathrm d\tau A_\mu \frac{\mathrm dx^\mu}{\mathrm d\tau}=\int A_\mu \mathrm dx^\mu \tag{4.29}

矢量场中粒子的完整作用量即

S=dτL,L=mcuμuμ+ecAμuμ(4.30)\boxed{S=\int \mathrm d\tau L,\quad L=-mc\sqrt{-u_\mu u^\mu}+\frac{e}{c}A_\mu u^\mu } \tag{4.30}

这里常数 ee 代表了粒子与矢量场 AμA_\mu 的耦合强度。对于电磁场,ee 即粒子的电荷。

​ 电磁场对粒子运动方程的贡献来源于对第二项的变分。有

δdτAμuμ=dτ(Aμxνδxνuμ+Aμδ(dxμdτ))dτ(AμxνuμδxνAμxνuνδxμ)dτFμνuνδxμ\begin{aligned} \delta\int \mathrm d\tau A_\mu u^\mu &=\int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}\delta x^\nu u^\mu+A_\mu\delta\left(\frac{\mathrm dx^\mu}{\mathrm d\tau} \right) \right)\\ &\simeq \int \mathrm d\tau\left(\frac{\partial A_\mu}{\partial x^\nu}u^\mu\delta x^\nu-\frac{\partial A_\mu}{\partial x^\nu}u^\nu\delta x^\mu \right)\equiv\int \mathrm d\tau F_{\mu\nu}u^\nu \delta x^\mu \end{aligned}

其中

Fμν:=AνxμAμxν(4.31)\boxed{F_{\mu\nu}:=\frac{\partial A_\nu}{\partial x_\mu}-\frac{\partial A_\mu}{\partial x_\nu}} \tag{4.31}

被称为电磁张量(electromagnetic tensor)或电磁场强。由定义可知 FμνF_{\mu\nu} 是一个反对称的张量,即 Fμν=FνμF_{\mu\nu}=-F_{\nu\mu}。结合自由粒子作用量的变分式,最终得到电磁场中粒子的运动方程为

dpμdτ=ecFμνuν(4.32)\frac{\mathrm d p_\mu}{\mathrm d\tau}=\frac{e}{c}F_{\mu\nu}u^\nu \tag{4.32}

​ 4-矢量 AμA^\mu 可以分解为

Aμ=(A0,Ai)(Φ,A)(4.33)A^\mu=(A^0,A^i)\equiv(\Phi,A) \tag{4.33}

其中 Φ\Phi 被称为标量势(scalar potential),AA 被称为矢量势(vector potential)。这里的所谓“标量”和“矢量“都是指 3 维空间中的标量和矢量。式(4.29)分解为

Aμdxμ=(A0dx0+δijAidxj)=(cΦdt+Aidxi)=dt(cΦ+Aivi)\begin{aligned} \int A_\mu \mathrm dx^\mu&=\int (-A^0\mathrm dx^0+\delta_{ij}A^i\mathrm dx^j)=\int (-c\Phi\mathrm dt+A_i\mathrm dx^i)\\ &=\int \mathrm dt(-c\Phi+A_iv^i) \end{aligned}、

可以得到电磁场中相对论性带电粒子作用量的 3 维形式即

S=dtL,L=mc21v2c2eΦ+ecvA(4.34)\boxed{S=\int \mathrm dtL,\quad L=-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A} \tag{4.34}

将式(4.34)对 xix^i 变分可得到运动方程的 3 维形式

dpdt=eE+ecv×B(4.35)\frac{\mathrm dp}{\mathrm dt}=eE+\frac{e}{c}v\times B \tag{4.35}

其中 pp 为 3-动量式。

E=Φ1cAt,B=×A(4.36)E=-\nabla \Phi-\frac 1c \frac{\partial A}{\partial t},\quad B=\nabla\times A\tag{4.36}

分别为电场强度 EE 和磁感应强度 BB 。式(4.35)的右边正是带电粒子在电磁场中所受的洛伦兹力。

推导

δS=dtδ(mc21v2c2eΦ+ecvA)=dt[mvi1v2c2δvieΦxiδxi+ec(Aiδvi+viδAi)]dt(dpidteΦxiecAt+ec(vjAjxiAixjvj))δxi\begin{aligned} \delta S &=\int \mathrm dt\delta\left(-mc^2\sqrt{1-\frac{v^2}{c^2}}-e\Phi+\frac{e}{c}v\cdot A \right)\\ &=\int \mathrm dt\left[\frac{mv_i}{\sqrt{1-\frac{v^2}{c^2}}}\delta v^i-e\frac{\partial \Phi}{\partial x^i}\delta x^i+\frac{e}{c}\left(A_i\delta v^i+v^i\delta A_i \right) \right]\\ &\simeq \int \mathrm dt\left(-\frac{\mathrm d p_i}{\mathrm dt}-e\frac{\partial \Phi}{\partial x^i} -\frac{e}{c}\frac{\partial A}{\partial t}+\frac{e}{c}\left(v^j\frac{\partial A_j}{\partial x^i} -\frac{\partial A_i}{\partial x^j}v^j\right) \right)\delta x^i \end{aligned}

其中

vjAjxiAixjvj=v(A)(v)A=v×(×A)v^j\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}v^j=v\cdot(\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A)

整理得到

dpdt=e(Φ1cAt)+cev×(×A)\frac{\mathrm dp}{\mathrm dt}=e\left(-\nabla \Phi-\frac{1}{c}\frac{\partial A}{\partial t} \right)+\frac{c}{e}v\times(\nabla\times A)

下证 v(A)(v)A=v×(×A)v\cdot (\nabla A)-(v\cdot \nabla)A=v\times(\nabla \times A)

[v(A)(v)A]i=vj(iAjjAi)[v\cdot(\nabla A)-(v\cdot\nabla)A]_i=v_j(\partial _i A_j-\partial _jA_i )

[v×(×A)]i=ϵijkvj(ϵkmnmAn)=(δimδjnδinδjm)vjmAn=vj(iAjjAi)\begin{aligned} {[v\times(\nabla\times A)]}_i &=\epsilon_{ijk}v_j(\epsilon_{kmn}\partial_m A_n)\\ &=(\delta_{im}\delta_{jn}-\delta_{in}\delta_{jm})v_j\partial_mA_n\\ &=v_j(\partial _i A_j-\partial_jA_i) \end{aligned}

4.5 非相对论极限下作用量的基本形式

​ 在非相对论极限下,作用量具有形式

S=dtL=dt(TV)(4.37)S=\int \mathrm dt L=\int \mathrm dt(T-V) \tag{4.37}

其中 TT 被称为动能(kinetic energy),VV 被称作势能(potential energy)。

​ 对于 NN 个粒子组成的粒子系统,记第 α\alpha 个粒子的直角坐标为 x(α)x_{(\alpha)},则系统的总动能为

T=α=1N12m(α)x˙(α)2(4.38)T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\dot{x}^2_{(\alpha)} \tag{4.38}

若换为广义坐标 {qa},a=1,,3N\{q^a\},a=1,\cdots,3N,则有

x(α)=x(α)(t,q),α=1,,N(4.39)x_{(\alpha)}=x_{(\alpha)}(t,q),\quad \alpha=1,\cdots,N \tag{4.39}

速度的变换关系为

x˙(α)x(α)qaq˙a+x(α)t(4.40)\dot{x}_{(\alpha)}\equiv\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t}\tag{4.40}

于是动能用广义坐标 {q}\{q\} 及广义速度 {q˙}\{\dot{q}\} 表示为

T=α=1N12m(α)(x(α)qaq˙a+x(α)t)(x(α)qbq˙b+x(α)t)(4.41)T=\sum_{\alpha=1}^N \frac 12 m_{(\alpha)}\left(\frac{\partial x_{(\alpha)}}{\partial q^a}\dot{q}^a+\frac{\partial x_{(\alpha)}}{\partial t} \right)\cdot\left(\frac{\partial x_{(\alpha)}}{\partial q^b}\dot{q}^b+\frac{\partial x_{(\alpha)}}{\partial t} \right) \tag{4.41}

整理得到

T=12Gabq˙aq˙b+Xaq˙a+Y(4.42)T=\frac{1}{2}G_{ab}\dot{q}^a\dot{q}^b+X_a\dot{q}^a+Y\tag{4.42}

即动能为广义速度的二次多项式,其中

Gab(t,q)=α=1Nm(α)x(α)xax(α)xb(4.43)G_{ab}(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial x^a}\cdot\frac{\partial x_{(\alpha)}}{\partial x^b}\tag{4.43}

Xa(t,q)=α=1Nm(α)x(α)qax(α)t(4.44)X_a(t,q)=\sum_{\alpha=1}^Nm_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial q^a}\cdot \frac{\partial x_{(\alpha)}}{\partial t} \tag{4.44}

Y(t,q)=α=1Nm(α)x(α)tx(α)t(4.45)Y(t,q)=\sum_{\alpha=1}^N m_{(\alpha)}\frac{\partial x_{(\alpha)}}{\partial t}\cdot\frac{\partial x_{(\alpha)}}{\partial t} \tag{4.45}

都只是与广义坐标和 tt 的函数,与广义速度无关。

​ 若约束非定常,则从直角坐标到广义坐标的变换 x(α)(t,q)x_{(\alpha)}(t,q) 显含时间,因此 XaX_aYY 一般不为零。对于定常系统, x(α)(q)x_{(\alpha)}(q) 不显含时间,因此

x(α)t=0  Xa=0, Y=0(4.46)\frac{\partial x_{(\alpha)}}{\partial t}=0\ \Rightarrow\ X_a=0,\ Y=0 \tag{4.46}

这意味着对于定常系统,动能总是广义速度的二次型

T=12Gab(q)q˙aq˙b(4.47)T=\frac{1}{2} G_{ab}(q) \dot{q}^a\dot{q}^b \tag{4.47}

这里 Gab(q)G_{ab}(q) 一般依赖于广义坐标,是一个对称、正定的矩阵,势能 VV 则只是广义坐标的函数

V=V(q)(4.48)V=V(q) \tag{4.48}

总之,非相对论性定常系统的拉格朗日量的一般形式即

L=TV=12Gab(q)q˙aq˙bV(q)(4.49)L=T-V=\frac 12 G_{ab}(q)\dot{q}^a\dot{q}^b -V(q)\tag{4.49}

Chapter 5 对称性和守恒律

5.1 运动常数

​ 考虑自由度为 ss 的完整系统,由广义坐标 qq 描述,拉格朗日量为 L=L(t,q,q˙)L=L(t,\boldsymbol q, \dot{\boldsymbol q}) 系统运动方程的解为 {qcl(t)}\{q_{cl}(t)\} ,即对应真实的运动。广义坐标 {qcl(t)}\{q_{cl}(t)\} 及广义速度 {q˙cl(t)}\{\dot{q}_{cl}(t) \} 一般是随时间变化的,但是存在 {t,q,q˙}\{t,\boldsymbol q,\dot{\boldsymbol q} \} 组成的函数 C=C(t,q,q˙)C=C(t,\boldsymbol q,\dot {\boldsymbol q}) ,其值只取决于初始条件,在真实的运动过程中保持不变,即有

dC(t,q(t),q(t))˙dtqcl=0(5.1)\left . \frac{\mathrm d C(t,\boldsymbol q(t),\dot {\boldsymbol q(t))}}{\mathrm dt}\right |_{q_{cl}}=0 \tag{5.1}

这样的函数被称为运动常数(constant of motion)。

Example 5.1 一维谐振子的运动常数

​ 考虑一维谐振子,拉格朗日量为 L=TV=12mq˙212mω2q2L=T-V=\frac 12 m\dot q^2-\frac 12 m\omega^2q^2,运动方程为 q¨+ω2q=0\ddot q+\omega ^2q=0。对应初始条件 q(0)=q0q(0)=q_0q˙(0)=v0\dot q(0)=v_0 的解为

qcl=q0cos(ωt)+v01ωsin(ωt)q_{cl}=q_0\cos(\omega t)+v_0\frac 1\omega\sin(\omega t)

对定解式求导,得到

q˙cl=q0ωsin(ωt)+v0cos(ωt)\dot q_{cl}=-q_0\omega\sin(\omega t)+v_0\cos(\omega t)

从中可以将 q0q_0v0v_0 解出

q0=qclcos(ωt)q˙clωsin(ωt),v0=qclωsin(ωt)+q˙clcos(ωt)q_0=q_{cl}\cos(\omega t)-\frac{\dot q_{cl}}{\omega}\sin(\omega t),\quad v_0=q_{cl}\omega\sin(\omega t)+\dot q_{cl}\cos(\omega t)

这里的 q0=q0(t,q,q˙)q_0=q_0(t,q,\dot q)v0=v0(t,q,q˙)v_0=v_0(t,q,\dot q) 即运动常数,即当 q=qclq=q_{cl} 时为常数。可以验证,两者的组合

12m(ω2q02+v02)=12mq˙2+12mω2q2E(q,q˙)\frac 12 m(\omega^2q_0^2+v_0^2)=\frac 12 m\dot q^2+\frac 12 m \omega^2 q^2\equiv E(q,\dot q)

也是运动常数,且不显含时间。

​ 如果运动常数只是 {q,q˙}\{\boldsymbol q,\dot {\boldsymbol q}\} 的函数,不显含时间 tt ,也被称为“整体”运动常数。考虑自由度为 ss 的系统,其运动方程为 ss 个二阶微分方程,需要 2s2s 个初始条件,亦即 2s2s 个常数 C1,C2,,C2sC_1,C_2,\cdots,C_{2s} 来确定一组解,记作

qcla=qcla(t,C1,,C2s),a=1,,s(5.2)q_{cl}^a=q_{cl}^a(t,C_1,\cdots,C_{2s}),\quad a=1,\cdots,s\tag{5.2}

式(5.2)对时间求导,得到

q˙cla=q˙cla(t,C1,,C2s)a=1,,s(5.3)\dot q_{cl}^a=\dot q_{cl}^a(t,C_1,\cdots,C_{2s}),a=1,\cdots,s \tag{5.3}

2s2s 个函数是独立的,可以从这 2s2s 个式子中的某一个解出时间参数 tt,再代入剩下的 2s12s-1 个式子中,即得到 2s12s-1 个不显含时间的 {q,q˙}\{\boldsymbol q,\dot {\boldsymbol q}\}C1,,C2sC_1,\cdots,C_{2s} 的关系式。从中可以再解出 2s2s 个常数 C1,,C2sC_1,\cdot,C_{2s} 中的 2s12s-1 个,作为 {q,q˙}\{\boldsymbol q,\dot{\boldsymbol q}\} 的函数,即整体运动常数。因此,自由度为 ss 的系统,具有 2s12s-1 个独立的整体运动常数。整体运动常数通常与系统的对称性有关,因此具有特别的重要性。

​ 假定系统由 AABB 两部分组成,且有各自的拉格朗日量

LA=TAVA,LB=TBVB(5.4)L_A=T_A-V_A,\quad L_B=T_B-V_B \tag{5.4}

若两部分的相互作用可以忽略,则动能和势能为两部分之和,因此

T=TA+TB,V=VA+VBL=LA+LB(5.5)T=T_A+T_B,\quad V=V_A+V_B\quad \Rightarrow\quad L=L_A+L_B \tag{5.5}

因此,对于没有相互作用的多个子系统构成的系统,拉格朗日量具有可加性(additicity)。此时系统拉格朗日量 LL 对应某子系统的运动方程,与子系统自身拉格朗日量对应的运动方程完全一致,就像其他子系统不存在一样。此时,拉格朗日量和对应的运动方程被称为是退耦(decoupled)的。常常在一组广义坐标中耦合在一起的各个子系统,选取另一组广义坐标后,就变成退耦或者近似退耦的。

​ 根据是否“可加”,可将运动常数分为“可加/不可加”两类。具有可加性的运动常数也被称为守恒量,在经典力学范围内有 7 个普适的守恒量:能量(1个),动量(3个),角动量(3个)。这些守恒量与时空对称性有着深刻的联系。

5.2 广义动量、能量守恒

5.2.1 广义动量守恒

​ 若拉格朗日量中不出现“某个”广义坐标 qaq^a ,即若

Lqa=0(5.6)\frac{\partial L}{\partial q^a}=0\tag{5.6}

则称此坐标为循环坐标(cyclic coordinate)。若 qaq^a 为循环坐标,则其对应的拉格朗日量为

0=ddt(Lq˙a)Lqa=0=ddt(Lq˙a)(5.7)0=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\underbrace{\frac{\partial L}{\partial q^a}}_{=0}=\frac{\mathrm d}{\mathrm dt}\left( \frac{\partial L}{\partial \dot q^a}\right)\tag{5.7}

上式表明 Lq˙\frac{\partial L}{\partial \dot q} 对时间的全导数为零,于是得到

paLq˙a=const(5.8)p_a\equiv\frac{\partial L}{\partial \dot q^a}=const \tag{5.8}

因此,循环坐标的共轭动量是运动常数。

5.2.2 广义能量守恒

​ 考虑 ss 自由度的系统,拉格朗日量 LL 对时间 tt 的全导数为

dLdt=Lt+Lqaq˙a+Lq˙aq¨a=Lt+Lqaq˙a+ddt(Lq˙aq˙a)ddt(Lq˙)q˙a=Lt+[ddt(Lq˙a)Lqa]=0q˙a+ddt(Lq˙aq˙a)(5.9)\begin{aligned} \frac{\mathrm dL}{\mathrm dt}&=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a=\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a\right )-\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q} \right)\dot q^a\\ &=\frac{\partial L}{\partial t}+\underbrace{\left[\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a} \right]}_{=0}\dot q^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a \right) \end{aligned} \tag{5.9}

因此当运动方程满足时,有下式

ddt(Lq˙aq˙aL)+Lt=0(5.10)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\dot q^a-L \right)+\frac{\partial L}{\partial t}=0 \tag{5.10}

定义能量函数(energy funtion)

h(t,q,q˙):=Lq˙q˙L(t,q,q˙)(5.11)h(t,q,\dot q):=\frac{\partial L}{\partial\dot q}\dot q-L(t,q,\dot q)\tag{5.11}

于是式(5.10)意味着

dhdt=Lt(5.12)\frac{\mathrm dh}{\mathrm dt}=-\frac{\partial L}{\partial t}\tag{5.12}

若物理系统的拉格朗日量不显含时间参数,即不存在任何特别的时间标记,则有

Lt=0h=h(t,q,q˙)=const(5.13)\frac{\partial L}{\partial t}=0\quad \Rightarrow\quad h=h(t,\boldsymbol q,\dot{\boldsymbol q})=const \tag{5.13}

即若拉格朗日量不显含时间,则能量函数是运动常数。因此能量函数守恒,这样的系统又被称作保守系统(conservative system)。

5.3 时空对称性与守恒量

5.3.1 空间的均匀性和各向同性

​ 考虑 NN 个粒子组成的粒子系统。广义坐标为普通的直角坐标 {x(α)},α=1,,N\{x_{(\alpha)} \},\alpha=1,\cdots,N ,拉格朗日量为

L=L(t,x(1),,x(N),x˙(1),,x˙(N))(5.14)L=L(t,x_{(1)},\cdots,x_{(N)},\dot x_{(1)},\cdots,\dot x_{(N)}) \tag{5.14}

考虑空间坐标的无穷小变换:

x(α)(t)x~(α)(t)=x(α)+δx(α)(t),α=1,,N(5.15)x_{(\alpha)}(t)\to\tilde{x}_{(\alpha)}(t)=x_{(\alpha)}+\delta x_{(\alpha)}(t),\quad \alpha=1,\cdots,N \tag{5.15}

注意在这里每个粒子可能有不同的 δx(α)\delta x_{(\alpha)} 。在空间坐标的变换式(5.15)下,作用量的变化为

δS=dt(Lx(α)δx(α)+Lx˙(α)δx˙(α))=dt[(ddtLx˙(α)Lx(α))=0δx(α)+ddt(Lx˙(α)δx(α))](5.16)\begin{aligned} \delta S&=\int \mathrm dt\left(\frac{\partial L}{\partial x_{(\alpha)}}\delta x_{(\alpha)}+\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta \dot x_{(\alpha)} \right)\\ &=\int \mathrm dt\left[-\underbrace{\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x_{(\alpha)}}-\frac{\partial L}{\partial x_{(\alpha)}} \right)}_{=0}\delta x_{(\alpha)}+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)} \right) \right] \end{aligned} \tag{5.16}

因此,当运动方程满足时(即真实演化),如果要求作用量在空间坐标的连续变换下保持不变,即 δS=0\delta S=0,则必须有

ddt(Lx˙(α)δx(α))=0α=1Np(α)δx(α)=const(5.17)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot x_{(\alpha)}}\delta x_{(\alpha)}\right)=0\quad \Rightarrow \quad\sum_{\alpha =1}^N p_{(\alpha)}\delta x_{(\alpha)}=const \tag{5.17}

其中 p(α)Lx˙(α)p_{(\alpha)}\equiv \frac{\partial L}{\partial \dot x_{(\alpha)}} 是第 α\alpha 个粒子的动量。

​ 考虑时间坐标的任意整体**平移 **(translation)

δx(1)=δx(2)==δx(N)ξaξ^=constant vector(5.18)\delta x_{(1)}=\delta x_{(2)}=\cdots =\delta x_{(N)}\equiv \boldsymbol \xi\equiv a \boldsymbol{\hat \xi}=constant\ vector \tag{5.18}

其中 aa 是常数,代表平移的距离;ξ^\hat \xi 是与时间无关的任意常单位矢量,代表平移的方向。对于 NN 个粒子组成的粒子系统来说,这意味着所有粒子的空间坐标朝着 ξ^\hat \xi 方向整体平移了相同的距离 aa 。如果系统再空间整体平移的变化下,作用量不变则称系统具有空间均匀性(spatial homogeneity)。这是式(5.17)变成

α=1Np(α)(aξ^)=const(5.19)\sum_{\alpha =1}^N p_{(\alpha)}\cdot(a\boldsymbol{\hat \xi})=const\tag{5.19}

而因为 aa 是个常数,这意味着

pξ^=const(5.20)p_总\cdot \boldsymbol{\hat \xi}=const \tag{5.20}

这里

pα=1Np(α)α=1NLx˙(α)(5.21)p_总\equiv\sum_{\alpha=1}^Np_{(\alpha)} \equiv \sum_{\alpha =1}^N\frac{\partial L}{\partial \dot x_{(\alpha)}}\tag{5.21}

是该系统的总动量。因此,如果系统沿着某个方向具有空间均匀性,则系统的总线动量在此方向的分量守恒。

​ 在 3 维欧氏空间中的无穷小转动下,直角坐标的变换为 δx=ϕn×x\delta x=\phi \boldsymbol n\times \boldsymbol x.其中 n\boldsymbol n 是任意单位常矢量。代表转动的转轴方向;ϕ\phi 是任意无量纲常数,代表无穷小转动角度。于是所有粒子共同做整体转动即

δx(α)=ϕn×x(α),α=1,,N(5.22)\delta \boldsymbol x_{(\alpha)}=\phi \boldsymbol n\times \boldsymbol x_{(\alpha)},\quad \alpha=1,\cdots ,N \tag{5.22}

2025.10.23 理论力学课上 3 维转动矩阵 R(n^,θ)\boldsymbol R(\hat n,\theta) 推导:

考虑 r\vec r 为三维列向量,并设 v\vec{v}_{\parallel}v\vec v_{\perp} 为平行和垂直于 n^\hat n 方向上的分量,有

{v=(vn^)n^v=v(vn^)n^\begin{cases} \vec v_{\parallel}=(\vec v\cdot \hat n)\hat n\\ \vec v_{\perp}=\vec v-(\vec v\cdot \hat n)\hat n \end{cases}

建立直角坐标系 {n^,v^,n^×v^}\{\hat n,\hat v_{\perp},\hat n\times \hat v_{\perp} \} ,其中 v^=vv\hat v_{\perp}=\frac{\vec v_{\perp}}{|\vec v_{\perp}|}

考虑 3 维转动矩阵 R(n^,θ)\boldsymbol R(\hat n,\theta)

R(n^,θ)v=R(n^,θ)v+R(n^,θ)v=v+vcosθv^+vsinθn^×v^=(vn^)n^+[v(vn^)n^]cosθ+sinθn^×[v(vn^)n^]=(1cosθ)(vn^)n^+cosθv+sinθn^×v\begin{aligned} \boldsymbol R(\hat n,\theta)\vec v&=\boldsymbol R(\hat n,\theta)\vec v_{\parallel}+\boldsymbol R(\hat n,\theta)\vec v_{\perp}\\ &=\vec v_{\parallel}+ |\vec v_{\perp}|\cos\theta \hat v_{\perp}+|\vec v_{\perp} |\sin\theta \hat n\times \hat v_{\perp}\\ &=(\vec v\cdot \hat n)\hat n+[\vec v-(\vec v\cdot \hat n)\hat n]\cos\theta+\sin\theta\hat n\times[\vec v-(\vec v\cdot \hat n)\hat n]\\ &=(1-\cos\theta)(\vec v\cdot \hat n)\hat n+\cos\theta \vec v+\sin\theta\hat n\times\vec v \end{aligned}

其中

(vn^)n^=n^Tvn^=n^n^Tv(\vec v\cdot\hat n)\hat n=\hat n^T\vec v\hat n=\hat n\hat n^T\vec v

n^×v=ϵijknjvk=(ϵikjnj)vk\hat n\times \vec v=\epsilon_{ijk}n_jv_k=-(\epsilon_{ikj}n_j)v_k

引入 3 为反对称矩阵 M(n^)\boldsymbol M(\hat n)

Mij(n^)=ϵijknk=(0n3n2n30n1n2n10)\boldsymbol M_{ij}(\hat n)=-\epsilon_{ijk}n_k= \begin{pmatrix} 0&-n_3&n_2\\ n_3&0&-n_1\\ -n_2&n_1&0 \end{pmatrix}

得到

R(n^,θ)v=[(1cosθ)n^n^T+cosθI3+sinθM(n^)]v\boldsymbol R(\hat n,\theta)\vec v=[(1-\cos\theta)\hat n\hat n^T+\cos \theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)]\vec v

所以

R(n^,θ)=(1cosθ)n^n^T+cosθI3+sinθM(n^)=(1cosθ)ninj+cosθδijsinθϵijknk=((1cosθ)n12+cosθ(1cosθ)n1n2sinθn3(1cosθ)n1n3+sinθn2(1cosθ)n2n1+sinθn3(1cosθ)n22+cosθ(1cosθ)n2n3sinθn1(1cosθ)n3n1sinθn2(1cosθ)n3n2+sinθn1(1cosθ)n32+cosθ)\begin{aligned} \boldsymbol R(\hat n,\theta)&=(1-\cos\theta)\hat n\hat n^T+\cos\theta \boldsymbol I_3+\sin\theta \boldsymbol M(\hat n)\\ &=(1-\cos\theta)n_in_j+\cos\theta\delta_{ij}-\sin\theta \epsilon_{ijk}n_k\\ &= \begin{pmatrix} (1-\cos\theta)n_1^2+\cos\theta &(1-\cos\theta)n_1n_2-\sin\theta n_3 &(1-\cos\theta)n_1n_3+\sin \theta n_2\\ (1-\cos\theta)n_2n_1+\sin\theta n_3& (1-\cos\theta)n_2^2+\cos\theta&(1-\cos\theta)n_2n_3-\sin\theta n_1\\ (1-\cos\theta)n_3n_1-\sin\theta n_2 &(1-\cos\theta)n_3n_2+\sin\theta n_1 &(1-\cos\theta)n_3^2+\cos\theta \end{pmatrix} \end{aligned}

θ\theta 为无穷小转动时

R(n^,θ)v=[I3+θM(n^)]v+O(θ2)=v+θn^×v+O(θ2)\boldsymbol R(\hat n,\theta)\vec v=[I_3+\theta \boldsymbol M(\hat n)]\vec v+O(\theta^2)=\vec v+\theta\hat n\times\vec v+O(\theta^2)

系统在整体转动下作用量不变,则称系统具有绕此方向的空间各向同性(spatial isotropy)。此时式(5.17)称为

α=1Np(α)(ϕn×x(α))=α=1Nϕn(x(α)×p(α))=const(5.23)\sum_{\alpha=1}^N\boldsymbol p_{(\alpha)}\cdot (\phi \boldsymbol n \times \boldsymbol x_{(\alpha)})=\sum_{\alpha =1}^N \phi\boldsymbol n\cdot(\boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)})=const\tag{5.23}

这里 ϕ\phi 是常数,意味着

Jn=const(5.24)\boldsymbol J_总\cdot \boldsymbol n=const \tag{5.24}

这里

J=α=1NJ(α)α=1Nx(α)×p(α)(5.25)\boldsymbol J_总=\sum_{\alpha=1}^N\boldsymbol J_{(\alpha)}\equiv \sum_{\alpha=1}^N \boldsymbol x_{(\alpha)}\times \boldsymbol p_{(\alpha)} \tag{5.25}

是粒子系统的总角动量。因此,如果系统绕某方向具有空间各向同性,则系统总角动量在此方向的分量守恒。

5.3.2 时间的均匀性

​ 若拉格朗日量不显含时间 Lt=0\frac{\partial L}{\partial t}=0,能量函数 hh 是运动常数。拉格朗日量不显含时间意味着,系统不存在特别的时间参照点,时间原点可以任意选取,即具有时间均匀性(temporal homogeneity),即时间是均匀流逝的。反映在拉格朗日量上,即时间平移(η\eta 是常数)

tt~=t+η(5.26)t\to \tilde t=t+\eta \tag{5.26}

不会引起拉格朗日量的变化。因此,能量守恒本质上反映的就是时间流逝的均匀性。

5.4 作用量的形式变换

5.4.1 拉格朗日量和全导数

​ 经典力学系统的演化由运动方程决定。初始条件(状态)给定,系统就沿着唯一的一条轨迹(相流)演化。但是拉格朗日量、作用量却有一定不确定性。如图所示,一组确定的运动方程,可以对应多个(无限多个)不如的拉格朗日量。如果两个拉格朗日量对应同一组运动方程,则两者被称为互相等价(equivalent)。

​ 物理上重要的一种等价关系,来自两个相差“时间全导数”的拉格朗日量。给定某个拉格朗日量 LL ,加上时间和广义坐标的任意函数 F(t,q)F(t,\boldsymbol q) 对时间的全导数,得到

L~(t,q,q˙)=L(t,q,q˙)+dF(t,q)dt(5.27)\tilde L(t,\boldsymbol q,\dot{\boldsymbol q}) = L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt}\tag{5.27}

对应的作用量变为

S~[q]=t1t2dtL~(t,q,q˙)=t1t2dt(L(t,q,q˙)+dF(t,q)dt)=S[q]+F(t,q)t1t2(5.28)\begin{aligned} \tilde S[\boldsymbol q]=\int_{t_1}^{t_2}\mathrm dt \tilde L(t,\boldsymbol q,\dot{\boldsymbol q})&=\int_{t_1}^{t_2}\mathrm dt\left(L(t,\boldsymbol q,\dot{\boldsymbol q})+\frac{\mathrm d F(t,\boldsymbol q)}{\mathrm dt} \right)\\ &=S[\boldsymbol q]+F(t,\boldsymbol q)|_{t_1}^{t_2} \end{aligned} \tag{5.28}

可以验证 δS~=δS\delta \tilde S=\delta S。变换式(5.27)有时也被称作拉格朗日量的规范变换(gague transformation)。

​ 习惯上用符号 “\simeq” 来表示两个拉格朗日量或者作用量等价。即有

L~=L+dFdt    L~L(5.29)\tilde L=L+\frac{\mathrm dF}{\mathrm dt}\iff \tilde L\simeq L\tag{5.29}

S~=S+Ft1t2    S~S(5.30)\tilde S=S+F|_{t_1}^{t_2}\iff \tilde S\simeq S \tag{5.30}

​ 值得一提的是,虽然相差时间全导数的两个拉格朗日量给出相同的运动方程,但是共轭动量和能量函数可能不同。由

L~=L+dF(t,q)dt=L+F(t,q)t+F(t,q)qaq˙a(5.31)\tilde L=L+\frac{\mathrm dF(t,\boldsymbol q)}{\mathrm dt}=L+\frac{\partial F(t,\boldsymbol q)}{\partial t}+\frac{\partial F(t,\boldsymbol q)}{\partial q^a}\dot q^a\tag{5.31}

于是 qaq^a 的共轭动量为

p~aL~q˙a=Lq˙a+Fqa=pa+Fqa(5.32)\tilde p_a\equiv \frac{\partial \tilde L}{\partial \dot q^a}=\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial q^a}=p_a+\frac{\partial F}{\partial q^a} \tag{5.32}

可见广义坐标的共轭动量具有一定任意性,这也是相空间中广义坐标和广义动量必须被视为完全独立的变量的原因之一。对于能量函数

h~L~q˙aq˙aL~=(Lq˙a+Fq˙a)q˙a(L+Ft+Fqaq˙a)=Lq˙aq˙aL=hFt\begin{aligned} \tilde h\equiv \frac{\partial \tilde L}{\partial \dot q^a}\dot q^a-\tilde L&=\left(\frac{\partial L}{\partial \dot q^a}+\frac{\partial F}{\partial \dot q^a} \right)\dot q^a-(L+\frac{\partial F}{\partial t}+\frac{\partial F}{\partial q^a}\dot q^a)\\ &=\underbrace{\frac{\partial L}{\partial \dot q^a}\dot q^a-L}_{=h}-\frac{\partial F}{\partial t} \end{aligned}

可见

h~=hFt(5.33)\tilde h=h-\frac{\partial F}{\partial t}\tag{5.33}

这一关系在哈密顿力学中被称作哈密顿量的正则变换。

5.4.2 广义坐标的变换

​ 我们采用不同的广义坐标和时间参数描述同一条世界线,对于变换 {t,q}{t~,q~}\{t,\boldsymbol q\}\to \{\tilde t,\tilde {\boldsymbol q}\}

tt~=t~(t,q),qq~=q~(t,q)(5.34)t\to \tilde t=\tilde t(t,\boldsymbol q),\quad \boldsymbol q\to\tilde{\boldsymbol q}=\tilde{\boldsymbol q}(t,\boldsymbol q)\tag{5.34}

本节中,假定时间参数 tt 不变,重点关注广义坐标的变换。

​ 对于位形空间中给定的某点及其对应的广义速度,因为式(5.34)只是变量代换,所以拉格朗日量的数值本身是不变的,即有

L(t,q,q˙)L~(t,q~,q~˙)L(t,q,q˙)(5.35)L(t,\boldsymbol q,\dot{\boldsymbol q})\to\tilde{L}(t,\tilde {\boldsymbol q},\dot{\tilde{\boldsymbol q}})\equiv L(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.35}

同样,沿着给定轨迹,作用量的变化为

S[q]S~[q~]:=dtL~(t,q~,q~˙)=dtL(t,q,q˙)S[q](5.36)S[\boldsymbol q]\to\tilde S[\tilde{\boldsymbol q}]:=\int \mathrm dt \tilde{L}(t,\tilde {\boldsymbol q},\dot {\tilde{\boldsymbol q}})=\int \mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\equiv S[\boldsymbol q]\tag{5.36}

​ 一个问题是,运动方程在广义坐标的变化下如何变化?由

δS[q]dt(ddtLq˙aLqa)δqaδS~[q~]dt(ddtLq~a˙L~q~a)δq~a(5.37)\delta S[\boldsymbol q]\simeq-\int \mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a\equiv\delta \tilde S[\tilde{\boldsymbol q}]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot{\tilde{q}^a}}-\frac{\partial \tilde L}{\partial \tilde{q}^a} \right)\delta \tilde q^a\tag{5.37}

利用广义坐标的逆变化式

δqa=qaq~bδq~b(5.38)\delta q^a=\frac{\partial q^a}{\partial \tilde q^b}\delta \tilde q^b\tag{5.38}

得到运动方程的变换关系

ddtL~q~a˙L~q~a=qbq~a(ddtLq˙bLqb),a=1,,s(5.39)\frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot{\tilde q^a}}-\frac{\partial \tilde L}{\partial \tilde q^a}=\frac{\partial q^b}{\partial \tilde q^a}\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^b}-\frac{\partial L}{\partial q^b} \right),\quad a=1,\cdots,s \tag{5.39}

如果将运动方程(即泛函导数 δSδqa\frac{\delta S}{\delta q^a}δS~δq~a\frac{\delta \tilde S}{\delta \tilde q^a})整体视为“矢量”,式(5.39)可以写成

δS~δq~aq~aqbδSδqb=0(5.40)\frac{\delta \tilde S}{\delta \tilde q^a}\equiv\frac{\partial \tilde q^a}{\partial q^b}\frac{\delta S}{\delta q^b}=0\tag{5.40}

其变换像协变矢量。

5.5 对称性

​ 在 5.3 节中已经看到,当拉格朗日量具有某些特殊形式时,会导致广义动量、能量的守恒,更物理的原因是,拉格朗日量的这些特殊形式反映了系统的对称性(symmetry)。简而言之,对称性即系统在某种变换(transformation)下的不变性(invariance)。

5.5.1 普通函数的对称性

​ 多元函数 F(x1,,xn)F(x^1,\cdots,x^n) 在自变量 xix^i 的任意无穷小变化 xix~i=xi+δxix^i\to \tilde x^i=x^i+\delta x^i 下,变化为

δF=Fxiδxi(5.41)\delta F=\frac{\partial F}{\partial x^i}\delta x^i \tag{5.41}

这里 Fxi\frac{\partial F}{\partial x^i} 是函数在自变量空间中的梯度。“对称变化”和“函数极值”相当于一个问题的一体两面。这个问题即函数在无穷小变化下的不变性,或者说——如何让函数不变。

​ (1)对于函数极值,相当于问梯度 Fxi\frac{\partial F}{\partial x^i} 满足什么条件时,是的对于任意的自变量的变化 δxi\delta x^i ,函数值不变,即

δF=Fxiδxi=对于任意 δxi0(5.42)\delta F=\frac{\partial F}{\partial x^i}\delta x^i \xlongequal{\text{对于任意 $\delta x^i$}} 0\tag{5.42}

由于 δxa\delta x^a 时任意的,于是只能要去梯度本身为零,即 Fxi=0\frac{\partial F}{\partial x^i}=0

​ (2)对于对称变换,其相当于问变换 δxi\delta x^i 满足什么条件时,使得函数总是不变的,即

δF=Fxiδsxi=对于任意 δsxi0(5.43)\delta F=\frac{\partial F}{\partial x^i}\delta_s x^i \xlongequal{对于任意\ \delta_s x^i}0 \tag{5.43}

δxi\delta x_i 不同,梯度 Fxi\frac{\partial F}{\partial x^i} 由 $F $ 的函数形式决定,所以并不是任意的。所以上式并不能导致 δsxi=0\delta_s x^i=0 ,而只是给出变换 δsxi\delta_s x^i 满足的一个关系式。

​ 可见,函数极值是对梯度 Fxi\frac{\partial F}{\partial x^i} 的限制,而对称变换则是对变换 δsxi\delta _sx^i 的限制,两者以不同的方式实现 δF=0\delta F=0 ,即函数在变分下的不变性。

5.5.2 时间与广义坐标的变换

​ 在数学上,对称变换则是在时间参数和广义坐标的变换下,作用量本身形式的变换。假设系统的广义坐标和时间参数有某种变换:

​ (1)时间的重参数化:

tt~=t~(t,q(t),q˙(t))(5.44)t\to \tilde t=\tilde t(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)) \tag{5.44}

​ (2)广义坐标的变换:

qa(t)q~a(t~)=q~a(t,q(t),q˙(t)),a=1,,s(5.45)q^a(t)\to \tilde q^a(\tilde t)=\tilde q^a(t,\boldsymbol q(t),\dot{\boldsymbol q}(t)),\quad a=1,\cdots,s\tag{5.45}

​ 一般来说,变换关系可以含有广义速度。如果变换可以由某个(某些)参数来参数化,且这些参数可以连续取值,则被称作连续变换(continuous transformation)。对于连续变换,当变换参数为无穷小量时,被称作无穷小变换(infintesimal transformation)。对于时间参数,其无穷小变换为

δst=t~t(5.46)\delta_s t=\tilde t-t\tag{5.46}

这里的 δs\delta_s 代表对称变换。广义坐标的无穷小变换定义为

δsqa(t):=q~a(t)qa(t)(5.47)\delta_sq^a(t):=\tilde q^a(t)-q^a(t) \tag{5.47}

虽然 δsqa\delta_sq^aδqa\delta q^a 在数学形式上一样,但其并不是任意的变分,而是满足某些条件的连续变换。我们还定义

Δqa(t):=q~a(t~)qa(t)(5.48)\Delta q^a(t):=\tilde q^a(\tilde t)-q^a(t)\tag{5.48}

以上 3 个无穷小变换 δst\delta_s tδsq\delta _s qΔqa\Delta q^a 的关系如下图所示

由式(5.46)和(5.47),展开得到

Δqa(t)=q~a(t+δst)qa(t)=q~a(t)+δStq~˙a(t)qa(t)\Delta q^a(t)=\tilde q^a(t+\delta_s t)-q^a(t)=\tilde q^a(t)+\delta_S t\dot{\tilde q}^a(t)-q^a(t)

带入 q~˙a=q˙a+ddt(δsqa)\dot{\tilde q}^a=\dot q^a+\frac{\mathrm d}{\mathrm dt}(\delta_s q^a) 并保留一阶小量,得到

Δqa(t)=δsqa+δstq˙a(5.49)\Delta q^a(t)=\delta_s q^a+\delta_st\dot q^a\tag{5.49}

可见 δst\delta _s tδsqa\delta_s q^aΔqa\Delta q^a 中只有 2 个是独立的。式(5.49)也可以由上图直观理解。定义

Δq˙a(t):=dq~a(t~)dt~dqa(t)dt=dtdt~ddt(qa(t)+Δqa(t))q˙a(t)(5.50)\Delta\dot q^a(t):=\frac{\mathrm d \tilde q^a(\tilde t)}{\mathrm d\tilde t}-\frac{\mathrm dq^a(t)}{\mathrm dt}= \frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t) \tag{5.50}

带入式(5.49),展开并保留到一阶小量,得到

Δq˙a(t)=dtdt~ddt(qa(t)+Δqa(t))q˙a(t)=(1d(δst)dt~)ddt(qa+δsqa+δstq˙a)q˙a=ddt(δsqa)+δstq¨a(5.51)\begin{aligned} \Delta \dot q^a(t)&=\frac{\mathrm dt}{\mathrm d\tilde t}\frac{\mathrm d}{\mathrm dt}(q^a(t)+\Delta q^a(t))-\dot q^a(t)\\ &=\left(1-\frac{\mathrm d(\delta_st)}{\mathrm d\tilde t} \right)\frac{\mathrm d}{\mathrm dt}(q^a+\delta_sq^a+\delta_st\dot q^a)-\dot q^a\\ &=\frac{\mathrm d}{\mathrm dt}(\delta_sq^a)+\delta_st\ddot q^a \end{aligned} \tag{5.51}

注意 Δq˙addt(Δqa)\Delta \dot q^a\neq\frac{\mathrm d}{\mathrm dt}(\Delta q^a)

5.5.3 作用量的对称性

​ 在式(5.44)和(5.55)的变换下,作用量的变换定义为

ΔS:=S~[q~]S[q]=t~1t~2dt~L(t~,q~,dq~dt~)t1t2dtL(t,q,q˙)(5.52)\begin{aligned} \Delta S:&=\tilde S[\boldsymbol{\tilde {q}}]-S[\boldsymbol q]\\ &=\int _{\tilde t_1}^{\tilde t_2}\mathrm d\tilde tL(\tilde t,\tilde {\boldsymbol q},\frac{\mathrm d\tilde{\boldsymbol q}}{\mathrm d\tilde t})-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q}) \end{aligned} \tag{5.52}

若要求作用量在变换下严格不变,则 ΔS0\Delta S\equiv 0 。但根据 5.4.1 节的讨论,两个作用量可以在相差边界项的意义下等价,即给出相同的运动方程。因此如果

ΔS=t1t2dtdFdt(5.53)\Delta S=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm dF}{\mathrm dt}\tag{5.53}

则变换被称作对称变换(symmetry transformation),而称作用量在此变换下不变(invariant)。此时系统所有的性质在此变换下不变,又因为变换参数可以连续取值,所以对称性被称作连续对称性(continuous symmetry)。需要强调的是,我们只是在讨论变换 δst\delta_s tδsqa\delta_s q^a 导致变换量形式的改变,而完全没有管运动方程是否满足(即 qa(t)q^a(t) 的函数形式如何)。无论运动方程是否满足,式(5.53)都必须成立,这样的变换才是系统的一个对称性。这体现了对称性式系统的内在属性,与运动方程是否满足(真实运动)没有关系。

​ 在无穷小变换式(5.46)和(5.48)下,利用式(5.49)和(5.51),将 ΔS\Delta S 展开并保留到一阶小量

ΔS=t1t2dtdt~dtL~(t~,q~(t~),dq~(t~)dt~)t1t2dtL(t,q,q˙)=t1t2dt(1+δstdt)L~(t+δst,q+δsq+δstq˙,q˙+d(δsq)dt+(δst)q¨)t1t2dtL(t,q,q˙)=t1t2dt(1+d(δst)dt)[L+Ltδst+Lqa(δsqa+δstq˙a)+Lq˙a(d(δsqa)dt+(δst)q¨a)]t1t2dtL=t1t2dt[Lqaδsqa+Lq˙ad(δsqa)dt=ddt(Lq˙aδsqa)ddtLq˙aδsqa+Ld(δst)dt+(Lt+Lqaq˙a+Lq˙aq¨a)=dLdtδst](5.54)\begin{aligned} \Delta S&=\int_{t_1}^{t_2}\mathrm dt\frac{\mathrm d\tilde t}{\mathrm dt}\tilde L(\tilde t,\tilde{\boldsymbol q}(\tilde t),\frac{\mathrm d\tilde{\boldsymbol q}(\tilde t)}{\mathrm d\tilde t}) -\int _{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\ &=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\delta_s t}{\mathrm dt} \right)\tilde L\left(t+\delta_st,\boldsymbol q+\delta_s\boldsymbol q+\delta_st\dot{\boldsymbol q},\dot{\boldsymbol q}+\frac{\mathrm d(\delta_s \boldsymbol q)}{\mathrm dt}+(\delta_st)\ddot{\boldsymbol q}\right)-\int_{t_1}^{t_2}\mathrm dtL(t,\boldsymbol q,\dot{\boldsymbol q})\\ &=\int_{t_1}^{t_2}\mathrm dt\left(1+\frac{\mathrm d(\delta_s t)}{\mathrm dt} \right)\left[ L+\frac{\partial L}{\partial t}\delta_st+\frac{\partial L}{\partial q^a}(\delta_sq^a+\delta_st\dot q^a)\right. \quad \left.+\frac{\partial L}{\partial \dot q^a}\left(\frac{\mathrm d(\delta_s q^a)}{\mathrm dt}+(\delta_st)\ddot q^a \right) \right]-\int_{t_1}^{t_2}\mathrm dtL\\ &=\int_{t_1}^{t_2}\mathrm dt\left[\frac{\partial L}{\partial q^a}\delta_sq^a+\underbrace{\frac{\partial L}{\partial \dot q^a}\frac{\mathrm d(\delta_sq^a)}{\mathrm dt}}_{=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a \right)-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\delta_sq^a} +L\frac{\mathrm d(\delta_st)}{\mathrm dt}+\underbrace{\left(\frac{\partial L}{\partial t}+\frac{\partial L}{\partial q^a}\dot q^a+\frac{\partial L}{\partial \dot q^a}\ddot q^a \right)}_{=\frac{\mathrm dL}{\mathrm dt}}\delta_s t\right]\\ \end{aligned} \tag{5.54}

整理得到

ΔS=t1t2dt[(LqaddtLq˙a)δsqa+ddt(Lq˙aδsqa+Lδst)](5.55)\Delta S=\int_{t_1}^{t_2}\mathrm dt\left[\left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) \right]\tag{5.55}

式(5.55)即是在变换下,作用量的变换。根据对称变换的定义式(5.53),即要求

(LqaddtLq˙a)δsqa+ddt(Lq˙aδsqa+Lδst)=dFdt(5.56)\left(\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm d t}\frac{\partial L}{\partial \dot q^a} \right)\delta_sq^a+\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_st \right) =\frac{\mathrm dF}{\mathrm dt} \tag{5.56}

这里的 FF 与具体的对称变换有关。式(5.56)是在变换式(5.46)和(5.47)下作用量不变,即使对称变换的充分必要条件,被称为诺特条件(Noether condition)。

​ 在式(5.56)中,第二项已经是时间全导数的形式,特别是时间变换 δst\delta_s t 的贡献总是对时间全导数的形式。所以式(5.56)成立仅对 δsqa\delta_sq^a 的形式做出要求。第一项的 LqaddtLq˙aδSδqa\frac{\partial L}{\partial q^a}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}\equiv \frac{\delta S}{\delta q^a} 对于欧拉-拉格朗日方程。于是式(5.56)可以改写成更方便也更有意义的形式

δSδqaδsqa=dQdt(5.57)-\frac{\delta S}{\delta q^a}\delta_s q^a=\frac{\mathrm d\mathcal Q}{\mathrm dt}\tag{5.57}

这里

Q:=paδsqa+LδstF(5.58)\mathcal Q:=p_a\delta_sq^a+L\delta_st-F \tag{5.58}

其中 pap_a 为广义动量。诺特条件可以写成其他等价形式,例如利用式(5.49),式(5.58)还可以写成

Q=paΔqahδstF(5.59)\mathcal Q=p_a\Delta q^a-h\delta_st-F\tag{5.59}

其中 hLq˙aq˙aLh\equiv \frac{\partial L}{\partial \dot q^a}\dot q^a-L 即能量函数。

5.6 诺特定理

5.6.1 诺特定理的证明

​ 现在假设已经找到了作用量的一个对称变换,当运动方程满足的时候,式(5.57)的左边为零,于是得到

dQdtδSδqaδsqa=满足运动方程时0(5.60)\frac{\mathrm d\mathcal Q}{\mathrm dt}\equiv-\frac{\delta S}{\delta q^a}\delta_sq^a\xlongequal{满足运动方程时}0 \tag{5.60}

亦即

dQdt=0(5.61)\frac{\mathrm d\mathcal Q}{\mathrm dt}=0\tag{5.61}

从而

Q=Lq˙aδsqa+LδstF=const(5.62)Q=\frac{\partial L}{\partial \dot q^a}\delta_sq^a+L\delta_s t-F=const \tag{5.62}

注意 QQ 和对称变换的参数有关,因此 QQ 本身还不是运动常数,因为运动常数定义为时间、广义坐标和广义速度的函数。

​ 但是有一个特殊,当变换参数与时间参数 tt 无关时,变换被称作整体变换(global transformation)。在单参数情形,即有

δst=ϵη(t,q,q˙)(5.63)\delta_st=\epsilon\eta(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.63}

δsqa=ϵξa(t,q,q˙),a=1,,s(5.64)\delta_sq^a=\epsilon\xi^a(t,\boldsymbol q,\dot{\boldsymbol q}),\quad a=1,\cdots,s \tag{5.64}

其中 ϵ\epsilon 是和时间参数 tt 无关的无穷小常数,η\etaξa\xi^a 则一般是时间 tt 、广义坐标及广义速度的函数。相应的边界项记为

F=ϵφ(t,q,q˙)(5.65)F=\epsilon\varphi(t,\boldsymbol q,\dot{\boldsymbol q}) \tag{5.65}

对于整体对称性,因为变换参数 ϵ\epsilon 是常数,可以将其提出,定义

Q:=1ϵQ=1ϵ(Lq˙aϵξa+Lϵηϵφ)(5.66)Q:=\frac 1\epsilon \mathcal Q=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot q^a}\epsilon \xi^a+L\epsilon \eta-\epsilon \varphi \right) \tag{5.66}

式(5.62)即意味着

QLq˙aξa+Lηφ=const(5.67)Q\equiv \frac{\partial L}{\partial \dot q^a}\xi^a+L\eta-\varphi=const \tag{5.67}

其是之和时间、广义坐标和广义速度有关的运动常数。式(5.67)对多个参数情形的推广是直接的。

​ 从而我们得到诺特定理(Noether’s theorem):若系统的作用量具有连续整体对称性,则当运动方程满足时,存在相应的运动常数。注意诺特定理成立的前提有三:

(1)对称性是连续对称性,所以才有无穷小变换的概念;

(2)对称性是整体对称性,即变换参数是常数(与 tt 无关);

(3)运动常数只存在于满足运动方程的真实演化过程中。

5.6.2 时空对称性

​ 考虑 NN 个粒子的系统,空间坐标的无穷小整体平移即

δξx(α)=ϵξ^(5.68)\delta_{\boldsymbol\xi}\boldsymbol x_{(\alpha)}=\epsilon\hat{\boldsymbol\xi}\tag{5.68}

其中 ξ^\hat{\boldsymbol \xi} 是常单位矢量。因为只是空间坐标的平移,时间参数不变所以 δst=0\delta_s t=0 。同时拉格朗日量严格不变,所以边界项 F=0F=0 。由式(5.68)得到运动常数

Q=α=1NLx˙(α)ξ^=α=1Np(α)ξ^=const(5.69)Q=\sum_{\alpha=1}^{N}\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot\hat{\boldsymbol \xi}=\sum_{\alpha=1}^N \boldsymbol p_{(\alpha)}\cdot\hat{\boldsymbol \xi}=const \tag{5.69}

即总动量在 ξ^\hat{\boldsymbol \xi} 方向的分量守恒。

​ 同样,空间坐标的无穷小整体转动即

δξx(α)=ϕn×x(α)(5.70)\delta_{\boldsymbol \xi}\boldsymbol x_{(\alpha)}=\phi\boldsymbol n\times \boldsymbol x_{(\alpha)} \tag{5.70}

其中 ϕ\phi 为无穷小转角。和整体平移的情形一样,有 δst=0\delta_st=0F=0F=0 。代入式(5.67)得到运动常数

Q=α=1NLx˙(α)(n×x(α))=α=1Nn(x(α)×p(α))=const(5.71)Q=\sum_{\alpha=1}^N\frac{\partial L}{\partial \dot{\boldsymbol x}_{(\alpha)}}\cdot(\boldsymbol n\times \boldsymbol x_{(\alpha)})=\sum_{\alpha=1}^N\boldsymbol n\cdot\left(\boldsymbol x_{(\alpha)}\times\boldsymbol p_{(\alpha)} \right)=const\tag{5.71}

即总角动量在 n\boldsymbol n 方向的分量守恒。

​ 时间的无穷小整体平移对应

δst=η(5.72)\delta_st=\eta\tag{5.72}

其中 η\eta 为无穷小常数。假设广义坐标式时间变换下的标量,

qa(t)q~a(t~)qa(t)(5.73)q^a(t)\to\tilde q^a(\tilde t)\equiv q^a(t)\tag{5.73}

Δqa=0\Delta q^a=0,由式(5.49)得到

δsqa=ηq˙a(5.74)\delta_sq^a=-\eta\dot q^a\tag{5.74}

要求作用量严格不变所以 F=0F=0 。代入式(5.67)得到运动常数

Q=Lq˙a(q˙a)+L=h=const(5.75)Q=\frac{\partial L}{\partial \dot q^a}(-\dot q^a)+L=-h=const \tag{5.75}

即能量守恒。

Example 5.13 一维阻尼谐振子的运动常数

​ 一维阻尼谐振子的运动方程可以由拉格朗日量 L=eλt(12mq˙212mω2q2)L=e^{\lambda t}\left(\frac12 m\dot q^2-\frac12m\omega^2q^2\right) 得到,其中 λ\lambda 为常数。考虑变换

tt~=t+α,q(t)q~(t~)=eλα2q(t)(5.76)t\to\tilde t=t+\alpha,\quad q(t)\to \tilde q(\tilde t)=e^{-\frac{\lambda \alpha}{2}}q(t)\tag{5.76}

其中 α\alpha 是常数。可以验证,在此变换下

S~[q~]=t~1t~2dt~eλt~[12m(dq~(t~)dt~)212mω2q~2]=t1t2dteλ(t+α)(12meλαq˙212mω2eλαq2)=t1t@dteλt(12mq˙212mω2q2)S[q]\begin{aligned} \tilde S[\tilde q]&=\int_{\tilde t_1}^{\tilde t_2} \mathrm d\tilde te^{\lambda\tilde t}\left[\frac12m\left(\frac{\mathrm d\tilde q(\tilde t)}{\mathrm d\tilde t}\right)^2-\frac12m\omega^2\tilde q^2 \right]\\ &=\int_{t_1}^{t_2}\mathrm dte^{\lambda(t+\alpha)}\left(\frac12me^{-\lambda\alpha}\dot q^2-\frac12m\omega^2e^{-\lambda\alpha}q^2 \right)\\ &=\int_{t_1}^{t_@}\mathrm dte^{\lambda t}\left(\frac12m\dot q^2-\frac12m\omega^2q^2 \right)\equiv S[q] \end{aligned}

其作用量严格不变。因为变换参数 α\alpha 是常数,所以变换式(5.76)是系统的整体对称性,为了应用诺特定理,首先令 αϵ\alpha\to \epsilon 为无穷小参数,得到无穷小变换

tt~=t+ϵ,q(t)q~(t~)=q(t)ϵλ2q(t)t\to\tilde t=t+\epsilon,\quad q(t)\to\tilde q(\tilde t)=q(t)-\epsilon\frac \lambda2 q(t)

δst=ϵΔq=ϵλ2q\delta_s t=\epsilon,\quad \Delta q=-\epsilon\frac\lambda 2q

由式(5.49)又得到

δsq=Δqδstq˙=ϵλ2qϵq˙\delta_sq=\Delta q-\delta_st\dot q=-\epsilon\frac \lambda 2q-\epsilon \dot q

于是对应式(5.73)和(5.74)即

η=1,ξ=λ2qq˙\eta=1,\quad \xi=-\frac \lambda 2q-\dot q

因为作用量严格不变,所以边界项 φ0\varphi\equiv0 。代入式(5.77)中得到运动常数

Q=Lq˙(λ2qq˙)+L=eλtmq˙(λ2q˙)+eλt(12mq˙212mω2q2)=eλt2(mq˙2+mλqq˙+mω2q2)\begin{aligned} Q&=\frac{\partial L}{\partial \dot q}\left(-\frac\lambda 2q-\dot q\right)+L=e^{\lambda t}m\dot q\left(-\frac\lambda 2-\dot q \right)+e^{\lambda t}\left(\frac 12m\dot q^2-\frac 12m\omega^2q^2 \right)\\ &=-\frac{e^{\lambda t}}{2}\left(m\dot q^2+m\lambda q\dot q+m\omega^2q^2 \right) \end{aligned}

Example 5.12 整体 U(1)\mathrm U(1) 对称性

​ 平面上运动的粒子的拉格朗日量为 L=12m(x˙2+y˙2)λ2(x2+y2)L=\frac 12m(\dot x^2+\dot y^2)-\frac \lambda 2(x^2+y^2) 。定义 ϕ=x+iy\phi=x+\mathbf i yϕ=xiy\phi^*=x-\mathbf iy ,则拉格朗日量可以写成 L=12mϕ˙2λ2ϕ2L=\frac 12m|\dot \phi|^2-\frac{\lambda}{2}|\phi|^2 。考虑变换

ϕϕ~=eiαϕ,ϕϕ~=eiαϕ(5.77)\phi\to\tilde\phi=e^{\mathbf i\alpha}\phi,\quad \phi^{*}\to\tilde\phi^*=e^{-\mathbf i\alpha}\phi^*\tag{5.77}

其中 α\alpha 是常数。式(5.77)是相位的变换,数学上构成所谓 U(1)\mathrm U(1) 群。在变换下

LL~=12mϕ~˙2λ2ϕ~2LL\to\tilde L=\frac 12m|\dot{\tilde\phi}|^2-\frac{\lambda}{2}|\tilde \phi|^2 \equiv L

即拉格朗日量是不变的。又因 α\alpha 是常数,所以式(5.77)是系统的整体 U(1)\mathrm U(1) 对称性。为了应用诺特定理,令 αϵ\alpha \to \epsilon 为无穷小参数,无穷小变换即为

δsϕ=iϵϕ,δsϕ=iϵϕ\delta_s\phi=\mathbf i\epsilon \phi,\quad \delta_s\phi^*=-\mathbf i\epsilon \phi^*

变换不涉及时间的变换,所以 δst=0\delta_st=0 。同时拉格朗日量严格不变,所以边界项 φ=0\varphi=0 。代入式(5.67)中,得到运动常数

QLϕ˙iϕ+Lϕ˙(iϕ)=im(ϕ˙ϕϕ˙ϕ)Q\equiv\frac{\partial L}{\partial \dot\phi}\mathbf i\phi+\frac{\partial L}{\partial \dot \phi^*}(-\mathbf i\phi^*)=\mathbf im(\dot \phi^*\phi-\dot \phi\phi^*)

为了看出这一运动常数的物理意义,将 ϕ\phiϕ\phi^* 代回直角坐标 xxyy ,得到

im(ϕ˙ϕϕ˙ϕ)=im[(x˙iy˙)(x+iy)(x˙+iy˙)(xiy)]=2m(xy˙yx˙)\mathbf im(\dot\phi^*\phi-\dot\phi\phi^*)=\mathbf im[(\dot x-\mathbf i\dot y)(x+\mathbf iy)-(\dot x+\mathbf i\dot y)(x-\mathbf iy)]=2m(x\dot y-y\dot x)

这里的 m(xy˙yx˙)m(x\dot y-y\dot x) 的物理意义正是粒子绕原点的角动量。整体 U(1)\mathrm U(1) 对称性正对应 2 维平面上的转动不变性,所以自然有角动量守恒。

Example 5.13 动力学对称

​ 考虑 DD 维欧氏空间中各向同性谐振子,取直角坐标 {xi}\{x^i\} ,拉格朗日量维 L=12mx2˙12mω2x2L=\frac12m\dot{\boldsymbol x^2}-\frac 12m\omega^2\boldsymbol x^2 。这一拉格朗日量当然具有时间平移和坐标整体转动的不变性。除此之外,其还具有额外的对称性。考虑无穷小变换

δ(kl)xi=ϵ12(x˙kδli+x˙lδki),i=1,,D(5.78)\delta_{(kl)} x^i=\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta^i_k),\quad i=1,\cdots,D\tag{5.78}

这里 ϵ\epsilon 为变换参数; k,lk,l 为给定指标,即对于每个 k,lk,l 的值,都有一个相应的变换,因为变换参数 ϵ\epsilon 是常数,所以这个变换是整体变换。对式(5.78)求时间导数有

δ(kl)x˙i=ϵ12(x¨kδli+x¨lδki),i=1,,D\delta_{(kl)}\dot x^i=\epsilon\frac12(\ddot x_k\delta_{l}^i+\ddot x_l\delta_k^i),\quad i=1,\cdots,D

于是在这个变换下

δ(kl)(x˙2)=2x˙iδ(kl)xi=ϵx˙i(x¨kδli+x¨lδki)=ϵ(x˙lx¨k+x˙kx¨l)=ϵddt(x˙kx˙l)\delta_{(kl)}(\dot{\boldsymbol x}^2)=2\dot x_i\delta_{(kl)}x^i=\epsilon \dot x_i(\ddot x_k\delta_l^i+\ddot x_l\delta_k^i)=\epsilon(\dot x_l\ddot x_k+\dot x_k\ddot x_l)=\epsilon\frac{\mathrm d}{\mathrm dt}(\dot x_k\dot x_l)

同样

δ(kl)(x2)=2xiδklxi=ϵxi(x˙kδli+x˙lδki)=ϵddt(xkxl)\delta_{(kl)}(\boldsymbol x^2)=2x_i\delta_{kl}x^i=\epsilon x_i(\dot x_k\delta_l^i+\dot x_l\delta_k^i)=\epsilon \frac{\mathrm d}{\mathrm dt}(x_kx_l)

于是作用量的变换为

Δ(kl)S=dt(12mδ(kl)(x˙2)12mω2δ(kl)(x2))=dtϵddt(12mx˙kx˙l12mω2xkxl)\begin{aligned} \Delta_{(kl)}S&=\int \mathrm dt\left(\frac 12m\delta_{(kl)}(\dot{\boldsymbol x}^2)-\frac 12m\omega^2\delta_{(kl)}(\boldsymbol x^2) \right)\\ &=\int \mathrm dt\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac12m\dot x_k\dot x_l-\frac 12m\omega^2 x_kx_l\right) \end{aligned}

可见在变换式(5.78)下,作用量不变,且得到非零边界项

F(kl)=ϵ(12mx˙lx˙l12mω2xkxl)F_{(kl)}=\epsilon(\frac12m\dot x_l\dot x_l-\frac 12m\omega^2x_kx_l)

变换不涉及时间,所以 δst0\delta_s t\equiv0 。根据诺特定理,存在运动常数

Q(kl)=1ϵ(Lx˙iδ(kl)xiF(kl))=1ϵ[mx˙iϵ12(x˙kδli+x˙lδki)ϵ(12mx˙kx˙l12mω2xkxl)]=12mx˙kx˙l+12mω2xkxl\begin{aligned} Q_{(kl)}&=\frac{1}{\epsilon}\left(\frac{\partial L}{\partial \dot x^i}\delta_{(kl)}x^i-F_{(kl)} \right)\\ &=\frac 1\epsilon\left[m\dot x_i\epsilon \frac 12(\dot x_k\delta_l^i+\dot x_l\delta_k^i)-\epsilon(\frac 12m\dot x_k\dot x_l-\frac12 m\omega^2x_kx_l) \right]\\ &=\frac 12m\dot x_k\dot x_l+\frac 12m\omega^2x_kx_l \end{aligned}

Q(kl)Q_{(kl)} 对于 k,lk,l 指标对称,对于 DD 维空间,有 12D(D+1)\frac 12D(D+1) 个独立分量。变换式(5.78)不是时间和空间坐标纯几何的变换,特别是变换中涉及速度,被称为动力学对称(dynamical symmetry)。在这个简单的例子中,变换式(5.78)对应哈密顿量在幺正变换的不变性。

5.6.3 标度对称性

​ 物理学中还有一种重要的整体对称性,即变量的整体缩放

tt~=eβt,qa(t)=q~(t~)=eαqa(t)(5.79)t\to \tilde t=e^\beta t,\quad q^a(t)\to=\tilde q(\tilde t)=e^\alpha q^a(t) \tag{5.79}

其中 α,β\alpha,\beta 是无量纲的常数,被称作标度变换(scale transformation)。恒等变换即对应 α=β=0\alpha=\beta=0 。标度变换相当于选取不同的单位(即标度)来衡量物理量。如果物理系统的作用量在标度变换下不变,则称其有标度不变性。

​ 对于定常系统,由式(4.47)作用量为

S[q]=dt(12Gab(q)q˙aq˙bV(q))(5.80)S[\boldsymbol q]=\int \mathrm dt\left(\frac 12G_{ab}(\boldsymbol q)\dot q^a\dot q^b-V(\boldsymbol q) \right)\tag{5.80}

在标度变换式(5.79)下,作用量变换为

S~[q~]=dt~(12Gab(q~)dq~adt~dq~bdt~V(q~))=dteβ(12Gab(eαq)e2(αβ)q˙aq˙bV(eαq))\begin{aligned} \tilde S[\tilde{\boldsymbol q}]&=\int \mathrm d\tilde t\left(\frac 12G_{ab}(\tilde{\boldsymbol q})\frac{\mathrm d\tilde q^a}{\mathrm d\tilde t}\frac{\mathrm d\tilde q^b}{\mathrm d\tilde t}-V(\tilde{\boldsymbol q}) \right)\\ &=\int \mathrm dte^\beta\left(\frac{1}2G_{ab}(e^\alpha\boldsymbol q)e^{2(\alpha-\beta)}\dot q^a\dot q^b- V(e^\alpha\boldsymbol q)\right) \end{aligned}

一般来说作用量并没有标度不变性。如果 Gab(q)G_{ab}(\boldsymbol q)V(q)V(\boldsymbol q) 都是广义坐标的齐次函数(homogeneous function),即对于任意常数 λ\lambda

Gab(λq)=λkGab(q),V(λq)=λpV(q)(5.81)G_{ab}(\lambda \boldsymbol q)=\lambda^kG_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.81}

其中 k,pk,p 是常数,于是

S~=dt(12Gab(q)e(2+k)αβq˙aq˙bepα+βV(q))\tilde S=\int \mathrm dt\left(\frac12G_{ab}(\boldsymbol q)e^{(2+k)\alpha-\beta}\dot q^a\dot q^b-e^{p\alpha+\beta}V(\boldsymbol q) \right)

作用量不变要求

(2+k)αβ=0,pα+β=0(5.82)(2+k)\alpha-\beta=0,\quad p\alpha+\beta=0\tag{5.82}

从中得到 k,pk,p 满足的条件

2+k+p=0(5.83)2+k+p=0 \tag{5.83}

​ 总之,定常系统式(5.80)具有标度不变性要求

Gab(λq)=1λ2+pGab(q),V(λq)=λpV(q)(5.84)G_{ab}(\lambda \boldsymbol q)=\frac {1}{\lambda^{2+p}}G_{ab}(\boldsymbol q),\quad V(\lambda \boldsymbol q)=\lambda^pV(\boldsymbol q)\tag{5.84}

其中 pp 为常数,由式(5.83)的第二式,相应的标度变换为

tt~=epαt,qa(t)q~a(t~)=eαqa(t)(5.85)t\to\tilde t=e^{-p\alpha}t,\quad q^a(t)\to\tilde q^a(\tilde t)=e^\alpha q^a(t) \tag{5.85}

其中 α\alpha 是常数。

Exercise 5.10

​ 已知非相对论极限下磁场中带电粒子的拉格朗日量为 L=12mv2+ecvAL=\frac{1}{2}m\boldsymbol v^2+\frac{e}{c}\boldsymbol v\cdot \boldsymbol A ,其中 cc 是光速, ee 是电荷, vx˙\boldsymbol v\equiv \dot{\boldsymbol x} 是粒子的速度, A\boldsymbol A 是失势。假设 A=12B×x\boldsymbol A=\frac 12\boldsymbol B\times \boldsymbol x,其中 B=Bez\boldsymbol B=B\boldsymbol e_zzz 方向的均匀磁场。

​ (1)求粒子的运动方程,证明其具有 v˙=v×ω\dot{\boldsymbol v}=\boldsymbol v\times \boldsymbol \omega 的形式。

​ (2)写出拉格朗日量在柱坐标 {r,ϕ,z}\{r,\phi,z\} 中的形式,证明虽然 ϕ\phi 是循环坐标,但是角动量的 zz 分量 Jzmr2ϕ˙J_z\equiv mr^2\dot \phi 却并不是运动常数,并解释其原因。

proof

(1)

ddtLviLxi=ddt(mvi+ecAi)ecvjAjxi=mv¨i+ecvj(AixjAjxi)=0(5.86)\begin{aligned} \frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial v^i}-\frac{\partial L}{\partial x^i}&=\frac{\mathrm d}{\mathrm dt}( mv_i+\frac{e}{c}A_i)-\frac{e}{c}v^j\cdot\frac{\partial A_j}{\partial x^i} \\ &=m\ddot v_i+\frac{e}{c}v^j\left(\frac{\partial A_i}{\partial x^j}-\frac{\partial A_j}{\partial x^i} \right)=0 \end{aligned} \tag{5.86}

因为 Bk=(×A)k=ϵkmnmAn\boldsymbol B^k=(\nabla \times\boldsymbol A)^k=\epsilon^{kmn}\partial_mA_n ,因此

ϵijkBk=ϵijkϵkmnmAn=(δimδjnδinδjm)mAn=AjxiAixj\epsilon_{ijk}B^k=\epsilon_{ijk}\epsilon^{kmn}\partial_mA_n=(\delta_i^m\delta_j^n-\delta_i^n\delta_j^m)\partial_mA_n=\frac{\partial A_j}{\partial x^i}-\frac{\partial A_i}{\partial x^j}

所以式(5.87)可以写成

mv¨i=ecϵijkvjBkm\ddot v_i=\frac{e}{c}\epsilon_{ijk}v^jB^k

mv¨=v×ecBm\ddot{\boldsymbol v}=\boldsymbol v\times \frac{e}{c}\boldsymbol B

(2)

v2=r˙2+r2ϕ˙2+z˙2vA=12Bez(v×x)=12Br2ϕ˙\boldsymbol v^2=\dot r^2+r^2\dot \phi^2+\dot z^2\\ \boldsymbol v\cdot \boldsymbol A=\frac 12 B\boldsymbol e_z\cdot(\boldsymbol v\times \boldsymbol x)=\frac 12 Br^2\dot\phi

所以

L=12m(r˙2+r2ϕ˙2+z˙2)e2cBr2ϕ˙L=\frac{1}{2}m(\dot r^2+r^2\dot\phi ^2+\dot z^2)-\frac{e}{2c}Br^2\dot\phi

显然 ϕ\phi 是循环坐标。

pϕ=Lϕ=mr2ϕ˙e2cBr2=constp_{\phi}=\frac{\partial L}{\partial \phi}=mr^2\dot\phi-\frac{e}{2c}Br^2=const

所以角动量的 zz 分量 JzJ_z 不是运动常数。因为洛伦兹力会产生力矩。

Chapter 6 辅助变量

6.1 拉格朗日乘子法

​ 对于有约束的系统,虽然作用量的变分仍是

δS[q]dt(ddtLq˙aLqa)δqa\delta S[\boldsymbol q]\simeq-\int\mathrm dt\left(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a} \right)\delta q^a

但是由于 δqa\delta q^a 不是相互独立,所以无法确定出 ss 个独立的运动方程。对于这样的已知约束的系统,有一个标准且有效的处理方法,即拉格朗日乘子法(method of Lagrange multipliers)。

6.1.1 函数的条件极值

​ 对于二元函数 F=F(x,y)F=F(x,y),以及约束 ϕ(x,y)=0\phi(x,y)=0FF 取极值的条件为

dF=Fxdx+Fydy=0(6.1)\mathrm dF=\frac{\partial F}{\partial x}\mathrm dx+\frac{\partial F}{\partial y}\mathrm dy=0\tag{6.1}

F=λϕ(6.2)\nabla F=-\lambda\nabla \phi \tag{6.2}

其中 λ\lambda 为常数,即拉格朗日乘子(Largrange multiplier)。由此问题可以转化为 3 元函数

F~(x,y,λ)F(x,y)+λϕ(x,y)(6.3)\tilde F(x,y,\lambda)\equiv F(x,y)+\lambda\phi(x,y)\tag{6.3}

在将 x,y,λx,y,\lambda 视为 3 个独立变量的情况下的极值条件,即

dF~=F~xdx+F~ydy+F~ϕdϕ=(Fx+λϕx)dx+(Fy+λϕy)dy+ϕdλ(6.4)\mathrm d\tilde F=\frac{\partial \tilde F}{\partial x}\mathrm dx+\frac{\partial \tilde F}{\partial y}\mathrm dy+\frac{\partial \tilde F}{\partial \phi}\mathrm d\phi=\left(\frac{\partial F}{\partial x}+\lambda\frac{\partial \phi}{\partial x} \right)\mathrm dx+\left(\frac{\partial F}{\partial y}+\lambda\frac{\partial \phi}{\partial y} \right)\mathrm dy+\phi\mathrm d\lambda\tag{6.4}

6.1.2 完整约束

​ 简单起见,只考虑存在 1 个完整约束的情形,约束方程为

ϕ(t,q)=0(6.5)\phi(t,\boldsymbol q)=0 \tag{6.5}

对于多个完整约束的推广是直接的。完整约束式(6.5)诱导出广义坐标变分之间的关系

δϕ=ϕqaδqa(6.6)\delta \phi=\frac{\partial \phi}{\partial q^a}\delta q^a \tag{6.6}

由于泛函导数 δSδqa\frac{\delta S}{\delta q^a} 相当于作用量 SS 在位形空间中的“梯度”,因此取极值时应该有

δSδqa=λϕqa,a=1,,s(6.7)\frac{\delta S}{\delta q^a}=-\lambda \frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.7}

这里的拉格朗日乘子 λ(t)\lambda(t) 一般也是时间参数 tt 的函数,但是和 {q}\{\boldsymbol q\}{q˙}\{\dot{\boldsymbol q}\} 无关。得到"“拓展”"后的作用量

S~[λ,q]=dt[L(t,q,q˙)+λ(t)ϕ(t,q)]\tilde S[\lambda,\boldsymbol q]=\int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q) \right]

写出对于的 s+1s+1 个欧拉-拉格朗日方程:

ddtL~q˙aL~qa=ddtLq˙aLqaλϕqa,a=1,,s(6.8)\frac{\mathrm d}{\mathrm dt}\frac{\partial \tilde L}{\partial \dot q^a}-\frac{\partial \tilde L}{\partial q^a}=\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}-\lambda\frac{\partial \phi}{\partial q^a},\quad a=1,\cdots,s\tag{6.8}

ddtL~λ˙L~λ=ϕ=0(6.9)\frac{\mathrm d}{\mathrm dt}\frac{\partial\tilde L}{\partial \dot \lambda}-\frac{\partial \tilde L}{\partial \lambda}=-\phi=0 \tag{6.9}

与多元函数情形一样,将拉格朗日乘子 λ\lambda 视为一个独立变量,其运动方程就是约束方程。

Example 6.2 用拉格朗日乘子法求解二维球面上的自由粒子

​ 考虑半径为 RR 的球面,一粒子约束在球面上运动,忽略摩擦和重力。这个问题中粒子的自由度为 2 ,可以直接取球面坐标 {θ,ϕ}\{\theta,\phi \} 。这里我们取 3 维直角坐标,约束即

ϕ(x,y,z)=x2+y2+z2R2=0\phi(x,y,z)=x^2+y^2+z^2-R^2=0

为完整约束。应用拉格朗日乘子法写出作用量

S[x,y,z,λ]=dt[12m(x˙2+y˙2+z˙2)λ(x2+y2+z2R2)]S[x,y,z,\lambda]=\int\mathrm dt\left[\frac 12m(\dot x^2+\dot y^2+\dot z^2)-\lambda(x^2+y^2+z^2-R^2) \right]

变分得到 x,y,zx,y,z 的运动方程

mx¨2λx=0,my¨2λy=0,mz¨2λz=0m\ddot x-2\lambda x=0,\quad m\ddot y-2\lambda y=0,\quad m\ddot z-2\lambda z=0

以及约束方程 ϕ(x,y,z)=0\phi(x,y,z)=0 ,一共 4 个方程,对应 4 个未知变量,可以得到 x¨x=y¨y=z¨z=2λm\frac{\ddot x}{x}=\frac{\ddot y}{y}=\frac{\ddot z}{z}=\frac{2\lambda}{m} ,因为 x,y,zx,y,z 都是独立变量,其成立条件当且仅当拉格朗日乘子 λ\lambda 取常数。

对约束式求时间导数得到

ϕ˙=2xx˙+2yy˙+2zz˙=2xx˙=0\dot \phi=2x\dot x+2y\dot y+2z\dot z=2\boldsymbol x\cdot\dot{\boldsymbol x}=0

上式意味粒子的速度切于球面。上式再求时间导数得到 x˙2+xx¨=0\dot {\boldsymbol x}^2+\boldsymbol x\cdot \ddot {\boldsymbol x}=0 ,代入前面的式子中得到

x˙2=2λmR2\dot{\boldsymbol x}^2=-\frac{2\lambda}{m}R^2

根据上面分析, $\lambda $ 为常数,使上式有意义必须要求 λ<0\lambda \lt 0 。实际上,上式即 E12mx˙2=λR2E\equiv \frac 12m\dot{\boldsymbol x}^2=-\lambda R^2 。在 3 维直角坐标下,粒子有 3 个自由度,状态空间由 {x,v}\{\boldsymbol x,\boldsymbol v\} 共 6 个变量描述。球面给出这 6 个变量的 3 个约束 x2=R2\boldsymbol x^2=R^2xx˙=0\boldsymbol x\cdot \dot{\boldsymbol x}=0v2=2Em\boldsymbol{v}^2=\frac{2E}{m} ,其中能量 EE 待定,因此独立变量的个数为 6+13=46+1-3=4 ,这与球面上粒子的自由度为 12×4=2\frac 12\times 4=2 也是自洽的。

6.1.3 非完整约束

​ 由以上讨论知,拉格朗日乘子法的关键在于约束可以视为位形空间中的曲面,从而给出如式(6.6)的广义坐标变分的线性关系。这对于非完整系统一般是不成立的,因此拉格朗日乘子法一般不能推广到非完整系统。对于形如 ϕ(t,q,q˙)=0\phi(t,\boldsymbol q,\dot{\boldsymbol q})=0 的非完整约束,写出作用量

dt[L(t,q,q˙)+λ(t)ϕ(t,q,q˙)](6.10)\int \mathrm dt\left[L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda(t)\phi(t,\boldsymbol q,\dot{\boldsymbol q}) \right] \tag{6.10}

并将 {q}\{\boldsymbol q\}λ\lambda 视为独立变量做变分,并不能得到非完整系统正确的运动方程,即作用量式(6.10)并不能正确描述非完整系统。实际上,一般的非完整系统并不能纳入最小作用量的框架内。

​ 一个例外是当非完整约束具有如下形式

ϕ(t,q,q˙)=Aa(t,q)q˙a+B(t,q)=0(6.11)\phi(t,\boldsymbol q,\dot{\boldsymbol q})=A_a(t,\boldsymbol q)\dot q^a+B(t,\boldsymbol q)=0\tag{6.11}

即只包含广义速度的“线性项”时,拉格朗日乘子法也是适用的。这是因为式(6.11)意味着 ϕdt=Aadqa+Bdt\phi \mathrm dt=A_a\mathrm dq^a+B\mathrm dt 。在任一瞬时(dt=0\mathrm dt=0),广义坐标的变分即满足关系

Aadqa=0(6.12)A_a\mathrm dq^a=0\tag{6.12}

这具有和式(6.6)同样的形式,只是式(6.6)中的“梯度” ϕqa\frac{\partial \phi}{\partial q^a} 被换成了一般的“矢量” AaA_a 。仿照完整约束的思路,即要求泛函的梯度 δSδqa\frac{\delta S}{\delta q^a}AaA_a 成正比

δSδqa=λAa(6.13)\frac{\delta S}{\delta q^a}=-\lambda A_a\tag{6.13}

等价的,即要求

d(δL+λAaδqa)=0(6.14)\int \mathrm d\left(\delta L+\lambda A_a\delta q^a \right)=0\tag{6.14}

即得到运动方程

ddtLq˙aLqa=λAa.a=1,,s(6.15)\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot q^a}-\frac{\partial L}{\partial q^a}=-\lambda A_a.\quad a=1,\cdots ,s\tag{6.15}

完整约束的式(6.8)可以认为是式(6.15)中 AaϕqaA_a\to \frac{\partial \phi}{\partial q^a} 的特殊情况。

​ 还有一种非完整约束是以积分形式给出的,例如

dtϕ(t,q,q˙)=C=const(6.16)\int \mathrm dt\phi(t,\boldsymbol q,\dot {\boldsymbol q})=C=const \tag{6.16}

这类约数被称为等周约束(isoperimetric constraint)。等周约束也可以用拉格朗日乘子法处理。这是因为等周约束式(6.18)的积分是一个常数,而作用量加上常数不影响极值,所以

S取极值    (S+λdtϕ)取极值(6.17)S取极值 \iff \left(S+\lambda\int\mathrm dt\phi\right)取极值\tag{6.17}

这里拉格朗日乘子法 λ\lambda 必须是个常数。因此,对于等周约束式(6.16),应用拉格朗日乘子法即相当于对于扩展的作用量

S~[q]=dt(L+λϕ)=dt(L(t,q,q˙)+λϕ(t,q,q˙))(6.18)\tilde S[\boldsymbol q]=\int \mathrm dt(L+\lambda\phi)=\int \mathrm dt(L(t,\boldsymbol q,\dot{\boldsymbol q})+\lambda\phi(t,\boldsymbol q,\dot{\boldsymbol q})) \tag{6.18}

在将 {q}\{\boldsymbol q\} 全部视为独立的情况下,求变分极值。对于等周约束,拉格朗日乘子法 $\lambda $ 是个常数(其值待定),不参与变分。

Example 6.5 包围最大面积的定长封闭曲线为圆周

​ 取平面直角坐标,平面上的曲线参数化为 x=x(s),y=y(s)x=x(s),y=y(s) ,这里 ss 是曲线的参数。封闭曲线所围面积为

A=12C(xdyydx)=12Cds(xy˙yx˙)A=\frac 12\oint_C(x\mathrm dy-y\mathrm dx)=\frac 12\oint_C\mathrm ds(x\dot y-y\dot x)

这里 x˙dxds,y˙dyds\dot x\equiv \frac{\mathrm dx}{\mathrm ds},\dot y\equiv\frac{\mathrm dy}{\mathrm ds} 。设曲线长度固定为 CC ,对于的等周约束即

Cdx2+dy2=Cdsx˙2+y˙2=C\oint_C\sqrt{\mathrm dx^2+\mathrm dy^2}=\oint_C \mathrm ds\sqrt{\dot x^2+\dot y^2}=C

于是拉格朗日乘子法要求泛函

A+λC=Cds[12(xy˙yx˙)+λx˙2+y˙2]A+\lambda C=\oint _C\mathrm ds\left[\frac 12(x\dot y-y\dot x)+\lambda\sqrt{\dot x^2+\dot y^2} \right]

在将 xxyy 视为独立变量的情况下取极值。对 xx 变分得到方程(注意 λ\lambda 为常数)

y˙λdds(x˙x˙2+y˙2=0)yλx˙x˙2+y˙2=y0\dot y-\lambda\frac{\mathrm d}{\mathrm ds}\left(\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=0 \right)\quad \Rightarrow\quad y-\lambda\frac{\dot x}{\sqrt{\dot x^2+\dot y^2}}=y_0

同理,对 yy 变分得到

xλy˙x˙2+y˙2=x0x-\lambda \frac{\dot y}{\sqrt{\dot x^2+\dot y^2}}=x_0

这里 x0x_0y0y_0 是常数。由上两式可以得到 (xx0)2+(yy0)2=λ2(x-x_0)^2+(y-y_0)^2=\lambda^2,这是一个以 (x0,y0)(x_0,y_0) 为圆心,半径为 λ\lambda 的圆。拉格朗日乘子法亦即半径 λ\lambda 的值由等周约束方程给出。

Example 6.6 最大熵概率分布

​ 孤立系统在平衡态的概率分布是的系统的熵取极大值,被称作最大熵概率分布(maximum entropy probability distribution)。假设系统处于某个能量 EE 的概率密度为 ρ(E)\rho(E) ,则系统的熵为 S[ρ]=dEρlnρS[\rho]=\int \mathrm dE\rho\ln \rho 。孤立系统需要满足两个约束条件:其一是总能量守恒,dEρE=E=const\int \mathrm dE\rho E=\Epsilon=const ;其二是概率密度的归一化条件, dEρ=1\int \mathrm dE\rho=1 。两个约束条件以积分形式出现,可视为等周约束。因此,使得熵取极值的概率分布即要求泛函

S~[ρ]=dEρlnρ+βdEρE+λdEρ\tilde S[\rho]=\int \mathrm dE\rho\ln \rho+\beta\int \mathrm dE\rho E+\lambda\int \mathrm dE\rho

取极值,这里 β\betaλ\lambda 为拉格朗日乘子,都是常数。对 ρ\rho 变分得到 δS~=dR(lnρ+1+βE+λ)δρ=0\delta \tilde S=\int \mathrm dR(\ln \rho+1+\beta E+\lambda)\delta \rho=0 ,从中解出 ρ=eλ1eβE\rho=e^{-\lambda-1}e^{-\beta E} 。这正是著名的玻尔兹曼分布(Boltzmann distribution)。

Chapter 7 微分变分原理

7.1 达朗贝尔原理

7.1.1 虚位移与虚功

​ 按照牛顿力学的观念,一切影响运动的因素都归结为力。既然运动被约束限制,这种限制自然也归结为所谓约束力(constraint force),即迫使力学系统遵循约束条件的力。相应地,和约束无关的力(即约束消失仍然存在)被称为主动力(applied force)。约束力这个概念虽然很直接,却带来了技术上的复杂性。运动方程中1的约束力不能预先确定,是未知量的一部分,只能用运动方程和约束方程联合求解。

​ 作为一种变分原理,达朗贝尔原理将广义坐标的变分称作虚位移(virtual displacement),即系统在任意的瞬时,满足约束条件的无穷小位移。力(包括主动力和约束力)在虚位移下所做的功即虚功(virtual work)。考虑 NN 个粒子构成的粒子系统。第 α\alpha 个粒子受到的主动力记为 F(α)\boldsymbol F_{(\alpha)} ,约束力记为 N(α)\boldsymbol N_{(\alpha)} 。则第 α\alpha 个粒子主动力的虚构即 N(α)δx(α)\boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)} 。某个粒子的虚位移平行于约束面,约束力则垂直于约束面,即虚位移与约束力总是垂直的 Nδx=0\boldsymbol N\cdot \delta \boldsymbol x=0 。受此启发,如果系统所有粒子受约束力所做的虚功之和为零,即

α=1NN(α)δx(α)=0(7.1)\sum_{\alpha=1}^N \boldsymbol N_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.1}

则该系统的约束称为理想约束(ideal constraint)。注意,理想约束是系统所受全部约束的一个整体性质,而不是某一个或某几个约束的性质。以下我们只讨论理想约束。

7.1.2 达朗贝尔原理的表述

​ 达朗贝尔原理的出发点是牛顿运动方程。考虑 NN 个粒子组成的粒子系统。每一个粒子都满足牛顿第二定理 F(α)+N(α)=m(α)x¨(α)\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}=m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)} ,即

F(α)+N(α)m(α)x¨(α)=0,α=1,,N(7.2)\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot{x}}_{(\alpha)}=0,\quad \alpha=1,\cdots,N\tag{7.2}

在牛顿力学中, m(α)x¨(α)-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} 可视为第 α\alpha 个质点所受的惯性力(inertial force)。设第 α\alpha 个粒子的虚位移为 δx(α)\delta \boldsymbol x_{(\alpha)} 。将式(7.2)与 δx(α)\delta \boldsymbol x_{(\alpha)} 作点乘,并对所有粒子求和,得到

α=1N(F(α)+N(α)m(α)x¨(α))δx(α)=0(7.3)\sum_{\alpha=1}^N \left(\boldsymbol F_{(\alpha)}+\boldsymbol N_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\cdot\delta \boldsymbol x_{(\alpha)}=0\tag{7.3}

而由理想约束条件式(7.1)知,系统约束力总的虚功为零,因此

α=1N(F(α)+m(α)x¨(α))δx(α)=0(7.4)\sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}+m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\delta x_{(\alpha)}=0 \tag{7.4}

式(7.4)意味着理想约束系统所受主动力和惯性力产生的总虚功为零,这就是达朗贝尔原理(d’Alembert principle)。在达朗贝尔原理中,约束力在方程中不再出现,从而化简了计算。达朗贝尔原理式(7.4)有一个简单的几何解释。因为虚位移 δx(α)\delta \boldsymbol x_{(\alpha)} 总是满足约束,即平行于约束面的,因此式(7.3)相当于牛顿运动方程(7.2)在平行于约束面方向的投影。而理想约束的约束力 N(α)\boldsymbol N_{(\alpha)} 可以认为是垂直于约束面的,因此在投影之下自然消失了,即得到式(7.4)。

​ 如果系统已经达到平衡状态,即有 x(α)=const\boldsymbol x_{(\alpha)}=const ,因此 x¨(α)=0\ddot{\boldsymbol x}_{(\alpha)}=0 。这时,达朗贝尔原理式(7.4)意味着

α=1NF(α)δx(α)=0(7.5)\sum_{\alpha=1}^N \boldsymbol F_{(\alpha)}\cdot\delta \boldsymbol x_{(\alpha)}=0 \tag{7.5}

即系统达到平衡的条件是所有主动力所做虚功之和为零,也被称作虚功原理(principle pf virtual work)。

Example 7.1 用虚功原理来求解平衡问题

​ 如图所示,四根长度为 ll 的硬杆用无摩擦的铰链连接,系统的位移由广义坐标 θ\theta 完全确定。若左右方向收到力 F1F_1 的挤压,上下方向收到力 F2F_2 的挤压。建立直角坐标,由几何关系 xA=lcosθ,xB=lcosθ,yC=lsinθx_A=-l\cos\theta,x_B=l\cos\theta,y_C=-l\sin\thetayD=lsinθy_D=l\sin\theta ,则虚功原理要求

0δWA+δWB+δWC+δWD=F1δxAF1δxB+F2δyCF2δyD=2l(F1sinθF2cosθ)δθ\begin{aligned} 0\equiv &\delta W_A+\delta W_B+\delta W_C+\delta W_D=F_1\delta x_A-F_1\delta x_B+F_2\delta y_C-F_2\delta y_D\\ =&2l\left(F_1\sin\theta-F_2\cos \theta \right)\delta \theta \end{aligned}

即要求 F1sinθF2cosθ=0F_1\sin\theta-F_2\cos\theta=0 ,因此达到平衡时满足 θ=arctanF2F1\theta=\arctan\frac{F_2}{F_1} 。相比受力分析的做法,用虚功原理可以更便捷地求解平很问题。

7.2 由达朗贝尔原理导出拉格朗日方程

​ 通过达朗贝尔原理,可以将牛顿第二定律改造成拉格朗日方程的形式。由于约束的存在,各个粒子的虚位移 δx(α)\delta \boldsymbol x_{(\alpha)} 不独立,所以从式(7.4)并不能得到

F(α)m(α)x¨(α)=0,α=1,,N\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}=0,\quad \alpha=1,\cdots,N

的结论。因此,首先需要对达朗贝尔原理用独立的广义坐标表达。对于 NN 个粒子组成的系统,假设存在 kk 个完整约束,于是可以选取 s=3Nks=3N-k 个独立的广义坐标 {qa},a=1,,s\{q^a\},a=1,\cdots,s 。第 α\alpha 个粒子的直角坐标 x(α)\boldsymbol x_{(\alpha)} 用广义坐标 {q}\{\boldsymbol q\} 表示为 x(α)=x(α)(t,q)\boldsymbol x_{(\alpha)}=\boldsymbol x_{(\alpha)}(t,\boldsymbol q) 。直角坐标的虚位移为

δx(α)=x(α)qaδqa,α=1,,N(7.6)\delta \boldsymbol x_{(\alpha)}=\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a,\quad \alpha=1,\cdots,N \tag{7.6}

将式(7.6)代入式(7.4)得到

α=1N(F(α)m(α)x¨(α))x(α)qaδqa=0\sum_{\alpha=1}^N(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol {\ddot x}_{(\alpha)})\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\delta q^a=0

ss 个广义坐标是相互独立的,因此上式的成立要求每一个 δqa\delta q^a 前面的系数都为零 ,即得到 ss 个独立的方程

α=1N(F(α)m(α)x¨(α))x(α)qa=0,a=1,,s\sum_{\alpha=1}^N\left(\boldsymbol F_{(\alpha)}-m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)} \right)\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=0,\quad a=1,\cdots,s

α=1Nm(α)x¨(α)x(α)qa=α=1NF(α)x(α)qa,a=1,,s(7.7)\sum_{\alpha=1}^N m_{(\alpha)}\boldsymbol{\ddot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a},\quad a=1,\cdots,s\tag{7.7}

其中

左边=ddt(α=1Nm(α)x˙(α)x(α)qa)α=1Nm(α)x˙(α)ddt(x(α)qa)=ddt(α=1Nm(α)x˙(α)x(α)qa)α=1Nm(α)x˙(α)x˙(α)qa=ddtqa(12α=1Nm(α)x˙(α)2)Tqa(12α=1Nm(α)x˙(α)2)T\begin{aligned} 左边&=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\mathrm d}{\mathrm dt} \left(\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)\\ &=\frac{\mathrm d}{\mathrm dt}\left(\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a} \right)-\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}\cdot \frac{\partial \boldsymbol {\dot x}_{(\alpha)}}{\partial q^a} \\ &=\frac{\mathrm d}{\mathrm dt}\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}^2_{(\alpha)} \right)}_{T}-\frac{\partial }{\partial q^a}\underbrace{\left(\frac 12\sum_{\alpha=1}^Nm_{(\alpha)}\boldsymbol{\dot x}_{(\alpha)}^2 \right)}_{T} \end{aligned}

左边=ddt(Tqa)Tqa(7.8)左边=\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a}\right)-\frac{\partial T}{\partial q^a}\tag{7.8}

对于式(7.7)的右边,定义广义力

右边=α=1NF(α)x(α)qaQa(7.9)右边=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv Q_a \tag{7.9}

因为广义坐标不必是长度量纲,所以广义力也不必是力的量纲,最终我们得到一组完全用独立的广义坐标表达的动力学方程

ddt(Tqa)Tqa=Qa,a=1,,s(7.10)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial q^a} \right)-\frac{\partial T}{\partial q^a}=Q_a,\quad a=1,\cdots,s\tag{7.10}

式(7.10)即拉格朗日方程。

7.2.1 保守系统

​ 当系统所受主动力全部都是保守力(conservative force)时,

F(α)=Vx(α)(7.11)\boldsymbol F_{(\alpha)}=-\frac{\partial V}{\partial \boldsymbol x_{(\alpha)}}\tag{7.11}

这里 V=V(x(1),,x(N))V(q)V=V(\boldsymbol x_{(1)},\cdots,\boldsymbol x_{(N)})\equiv V(\boldsymbol q) 是势能,只依赖与系统的位形。式(7.10)中的广义力可以写成

Qa=α=1NF(α)x(α)qa=α=1NVx(α)x(α)qaVqaQ_a=\sum_{\alpha=1}^N\boldsymbol F_{(\alpha)}\cdot\frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}=-\sum_{\alpha=1}^N\frac{\partial V}{\partial x_{(\alpha)}}\cdot \frac{\partial \boldsymbol x_{(\alpha)}}{\partial q^a}\equiv\frac{\partial V}{\partial q^a}

代入式(7.10)得到

ddt(Tq˙a)Tqa=Vqa(7.12)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial T}{\partial q^a}=-\frac{\partial V}{\partial q^a}\tag{7.12}

ddt(Tq˙a)(TV)qa=0(7.13)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial T}{\partial \dot q^a} \right)-\frac{\partial (T-V)}{\partial q^a}=0\tag{7.13}

因为势能与广义速度无关, Tq˙a(TV)q˙a\frac{\partial T}{\partial \dot q^a}\equiv\frac{\partial(T-V)}{\partial \dot q^a} 。因此,若定义 LTVL\equiv T-V ,式(7.13)可以进一步写成

ddt(Lq˙a)Lqa=0,a=1,,s(7.14)\frac{\mathrm d}{\mathrm dt}\left(\frac{\partial L}{\partial \dot q^a} \right)-\frac{\partial L}{\partial q^a}=0,\quad a=1,\cdots,s\tag{7.14}

式(7.14)即是完整、保守系统的拉格朗日方程,其中 LTVL\equiv T-V 即拉格朗日量。这里也再次看出,拉格朗日量为牛顿力学的动能减去势能。

Chapter 8 两体问题

8.1 两体系统

​ 两个相互作用的粒子组成的封闭系统即两体系统。研究两体系统的运动问题即所谓两体问题(two-body problem)。通常两体问题有严格解。

​ 两体问题可分为三类。一种情况是两个粒子不会无限分离,保持有限距离,被称为束缚态(bound state)。另一种情况是两个粒子从无穷远处靠近,经相互作用改变彼此的运动状态,之后又相互分离至无穷远,被称作碰撞(collision)或散射(scattering)。还有一种情况是两粒子经过相互作用合二为一,或者一个例子一分为二,被称为俘获(capture)或衰变(decay)。

8.1.1

​ 设两粒子的质量分别为 m1m_1m2m_2 ,空间位置用直角坐标记为 x1\boldsymbol x_1x2\boldsymbol x_2 。两体系统的动能为

T=12m1x˙12+12m2x˙22(8.1)T=\frac 12m_1\dot {\boldsymbol x}_1^2+\frac 12m_2\dot{\boldsymbol x}_2^2\tag{8.1}

相互作用势能为 V=V(x1,x2)V=V(\boldsymbol x_1,\boldsymbol x_2) ,只和两个粒子的空间位置有关。由空间对称性,可以对势能的形式作进一步的要求,

V(x1,x2)=V(x1x2)(8.2)V(\boldsymbol x_1,\boldsymbol x_2)=V(\boldsymbol x_1-\boldsymbol x_2)\tag{8.2}

即空间均匀性决定相互作用势能只和相对位置有关。如果进一步要求空间是各向同性的,即在任意转动下也不变,则势能具有形式

V(x1x2)=V(x1x2)(8.3)V(\boldsymbol x_1-\boldsymbol x_2)=V(|\boldsymbol x_1-\boldsymbol x_2|)\tag{8.3}

即只和两粒子的相对距离大小有关,和方向无关。

​ 总之,在空间均匀和各向同性的要求下,两体系统的拉格朗日量为

L=12m1x˙1+12m2x˙22V(x1x2)(8.4)L=\frac 12m_1\dot{\boldsymbol x}_1+\frac 12m_2\dot{\boldsymbol x}_2^2-V(|\boldsymbol x_1-\boldsymbol x_2|) \tag{8.4}

对于两体系统,由于相互作用势能 V(x1x2)V(|\boldsymbol x_1-\boldsymbol x_2|) 的存在,两个粒子之间产生的关系,被称作耦合(coupled)。

8.1.2 两体系统的退耦

​ 以两体各自的坐标 x1,x2\boldsymbol x_1,\boldsymbol x_2 为变量,两体系统的运动方程是耦合在一起的,但我们可以选取新的广义坐标使得两体系统退耦(decoupled),即等效为两个相互独立的单粒子的运动。

​ 考虑与 {x1,x2}\{\boldsymbol x_1,\boldsymbol x_2\} 满足线性关系的一组新的坐标 {y1,y2}\{\boldsymbol y_1,\boldsymbol y_2\} ,线性变换关系为

(x1x2)=(abcd)(y1y2)(8.5)\begin{pmatrix} \boldsymbol x_1\\ \boldsymbol x_2 \end{pmatrix} = \begin{pmatrix} a&b\\ c&d \end{pmatrix} \begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} \tag{8.5}

其中 a,b,c,da,b,c,d 为常数。在式(8.5)的变换下,动能项变为

T=12(x1x2)(m100m2)(x1x2)=12(y1y2)(m1a2+m2c2m1ab+m2cdm1ab+m2cdm1b2+m2d2)(y1y2)(8.6)\begin{aligned} T&=\frac 12 \begin{pmatrix} \boldsymbol x_1 & \boldsymbol x_2 \end{pmatrix} \begin{pmatrix} m_1 & 0\\ 0 & m_2 \end{pmatrix} \begin{pmatrix} \boldsymbol x_1\\ \boldsymbol x_2 \end{pmatrix}\\ &=\frac 12 \begin{pmatrix} \boldsymbol y_1 & \boldsymbol y_2 \end{pmatrix} \begin{pmatrix} m_1a^2+m_2c^2 & m_1ab+m_2cd\\ m_1ab+m_2cd & m_1b^2+m_2d^2 \end{pmatrix} \begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} \end{aligned} \tag{8.6}

如果要求用新的变量 y1,y2\boldsymbol y_1,\boldsymbol y_2 表达的动能项时退耦的,就必须要求非对角元为零,即

m1ab+m2cd=0(8.7)m_1ab+m_2cd=0\tag{8.7}

由式(8.5),相互作用的势能项变为 V=V((ac)y1+(bd)y2)V=V(|(a-c)\boldsymbol y_1+(b-d)\boldsymbol y_2 |) 。因此,如果要求势能式退耦的,则只能是 a=ca=cb=db=d 。不失一般性,不妨取

a=c(8.8)a=c\tag{8.8}

​ 同时满足式(8.7)和(8.8)的线性变换的一般形式为

(y1y2)=(1axc1bm2m1+m2r)(8.9)\begin{pmatrix} \boldsymbol y_1\\ \boldsymbol y_2 \end{pmatrix} = \begin{pmatrix} \frac 1a\boldsymbol x_c\\ \frac 1b \frac{m_2}{m_1+m_2}\boldsymbol r \end{pmatrix} \tag{8.9}

其中 a,ba,b 为任意常数,这里自然出现了两体系统的质心位置 xc\boldsymbol x_c 和两粒子的相对位矢 r\boldsymbol r ,定义

xc:=m1x1+m2x2m1+m2,r=x1x2(8.10)\boldsymbol x_c:=\frac{m_1\boldsymbol x_1+m_2\boldsymbol x_2}{m_1+m_2},\quad \boldsymbol r=\boldsymbol x_1-\boldsymbol x_2\tag{8.10}

简单起见,不妨取 a=1,b=m2m1+m2a=1,b=\frac{m_2}{m_1+m_2} 。即有 y1=xc\boldsymbol y_1=\boldsymbol x_cy2=r\boldsymbol y_2=\boldsymbol r 。此时动能项成为

T=12(xcr)(mt00mr)(xcr)(8.11)T=\frac12 \begin{pmatrix} \boldsymbol x_c & \boldsymbol r \end{pmatrix} \begin{pmatrix} m_t & 0 \\ 0 & m_r \end{pmatrix} \begin{pmatrix} \boldsymbol x_c \\ \boldsymbol r \end{pmatrix}\tag{8.11}

其中, mtm_t 为两体系统的总质量

mtm1+m2(8.12)m_t\equiv m_1+m_2 \tag{8.12}

mrm_r 被称为约化质量(reduced mass)

mrm1m2m1+m2(8.13)m_r\equiv\frac{m_1m_2}{m_1+m_2} \tag{8.13}

相互作用势能项为 V=V(x1x2)=V(r)V=V(|\boldsymbol x_1-\boldsymbol x_2|)=V(r) ,只是两粒子相对距离,即相对位矢大小 rrr\equiv|\boldsymbol r| 的函数,也是完全退耦的。

​ 总之,在空间均匀和各向同性的假设下,两体系统可以完全退耦,即约化为两个单粒子的运动,分别对应两体系统的质心运动与相对运动。其质心运动的拉格朗日量为

Lc=12mcx˙c2(8.14)L_c=\frac 12m_c\dot{\boldsymbol x}_c^2\tag{8.14}

其等效于质量为 mtm_t 的自由粒子。相对运动的拉格朗日量为

Lr=12mrr˙2V(r)(8.15)L_r=\frac 12m_r\dot{\boldsymbol r}^2-V(r)\tag{8.15}

等效于位于中心势场 V(r)V(r) 中质量为 mrm_r 的粒子。

8.2 中心势场

8.2.1 中心势场中的运动

​ 两体系统的质心作匀速直线运动,因此我们重点关注两体系统的相对运动,即单粒子在中心势场中的运动。记 mmrm\equiv m_r ,拉格朗日量式(8.15)的运动方程为

mr¨=V(8.16)m\ddot{\boldsymbol r}=-\nabla V\tag{8.16}

r=rrr^\nabla r=\frac{\boldsymbol r}{r}\equiv\hat r ,式(8.16)又可以写成

mr¨=V(r)rr(8.17)m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\tag{8.17}

欧式空间中梯度算符定义为 =eixi\nabla=\boldsymbol e^i\frac{\partial }{\partial x^i},所以

r=eirxi=rr\nabla r=\boldsymbol e^i \frac{\partial r}{\partial x^i}=\frac{\boldsymbol r}{r}

V=eiVxi=Vreirxi=Vrr\nabla V=\boldsymbol e^i \frac{\partial V}{\partial x^i}=\frac{\partial V}{\partial r} \boldsymbol e^i\frac{\partial r}{\partial x^i}=V'\frac{\boldsymbol r}{r}

​ 中心势场具有球对称性,因此更方便的是选取球坐标 {r,θ,ϕ}\{r,\theta,\phi\} ,于是式(8.15)成为

L=12m(r˙2+r2θ˙2+r2sin2θϕ˙2)V(r)(8.18)L=\frac 12 m\left(\dot r^2+r^2\dot\theta^2+r^2\sin^2\theta\dot \phi^2 \right)-V(r) \tag{8.18}

式(8.18)即是中心势场中粒子的拉格朗日量。

​ 拉格朗日量式(8.18)不含 ϕ\phi ,即 ϕ\phi 是循环坐标,于是其共轭动量是运动常数

pϕLϕ˙=mr2sin2θϕ˙=const=Jz(8.19)p_\phi\equiv\frac{\partial L}{\partial \dot \phi}=mr^2\sin^2\theta\dot \phi=const=\boldsymbol J_z\tag{8.19}

由于空间各向同性,所以 zz 轴可以任取,说明中心势场中粒子的角动量矢量守恒

J=const(8.20)\boldsymbol J=const \tag{8.20}

​ 中心势场中粒子的角动量守恒意味着中心势场中的粒子必做平面运动。因为角动量矢量的定义为

J=r×p(8.21)\boldsymbol J=\boldsymbol r\times\boldsymbol p\tag{8.21}

意味着相对中心的位矢 r\boldsymbol r 和动量 p\boldsymbol p 都和角动量垂直,换句话说,粒子的运动完全处于和角动量矢量 J\boldsymbol J 垂直的平面内。

​ 既然如此,可取平面极坐标 {r,ϕ}\{r,\phi \} 进一步简化计算。这时式(8.18)变成

L=12m(r˙2+r2ϕ˙2)V(r)(8.22)L=\frac 12m(\dot r^2+r^2\dot \phi^2)-V(r) \tag{8.22}

这时 ϕ\phi 是循环坐标。共轭动量是运动常数

pϕmr2ϕ˙2=constJ(8.23)p_\phi\equiv mr^2\dot \phi^2=const\equiv J \tag{8.23}

​ 拉格朗日量式(8.22)不显含时间,能量函数为运动常数

h12m(r˙2+r2ϕ˙2)+V(r)=const=E(8.24)h\equiv \frac 12m(\dot r^2+r^2\dot \phi^2)+V(r)=const=E\tag{8.24}

对于中心势场的粒子,因为动能是广义速度的二次型,所以 EE 即粒子的总能量。

​ 以上我们得到中心势场中的粒子的两个运动常数,角动量大小为 JJ 和总能量 EE ,由式(8.23)和(8.24)消去 ϕ˙\dot \phi ,得到

E=12mr˙2+J22mr2+V(r)(8.25)E=\frac 12m\dot r^2+\frac {J^2}{2mr^2}+V(r) \tag{8.25}

这是关于径向坐标 r=r(t)r=r(t) 的单变量方程,且是一个一阶方程。由式(8.25)解出 r˙\dot r

drdt=±2m(EV(r))J22mr2(8.26)\frac{\mathrm dr}{\mathrm dt}=\pm\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}\tag{8.26}

积分得到

t=±dr2m(EV(r))J22mr2(8.27)t=\pm\int\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}}\tag{8.27}

给定势能 V(r)V(r) ,原则上由式(8.27)可以积出得到 t=t(r)t=t(r) ,亦即径向坐标随时间的演化 r=r(t)r=r(t) 。再代入式(8.23),即得到

ϕ=ϕ(t)=dtJmr2(t)(8.28)\phi=\phi(t)=\int\mathrm dt\frac{J}{mr^2(t)} \tag{8.28}

即角坐标随时间的变化关系。由式(8.23)和(8.26)消去 dt\mathrm dt ,得到

mr2Jdϕ=±dr2m(EV(r))J22mr2(8.29)\frac{mr^2}{J}\mathrm d\phi=\pm\frac{\mathrm dr}{\sqrt{\frac 2m(E-V(r))-\frac{J^2}{2mr^2}}} \tag{8.29}

对上式积分,即可得到轨迹方程 r=r(ϕ)r=r(\phi) 。遗憾的是,只有少数几种数学形式的 V(r)V(r) ,才能使式(8.29)得到解析结果。

8.2.2 定性讨论

​ 由式(8.23)解得

ϕ˙=J2mr2(8.30)\dot \phi=\frac{J}{2mr^2}\tag{8.30}

由之可得到如下定性结论:因为角动量守恒,且 J>0J>0 ,因此 ϕ\phi 总是随时间单调变化,即粒子总是朝一个方向运动而不会回转。另一方面,式(8.30)意味着 ϕ˙1r2\dot \phi \propto \frac{1}{r^2} ,即距离中心越近转得越快,距离中心越远,转的越慢。这正是角动量守恒,亦即势能与动能相互转化的结果。

​ 由式(8.25)知,径向运动可以看成单粒子在有效势能

Veff(r)=V(r)+J22mr2(8.31)V_{\mathrm{eff}}(r)=V(r)+\frac{J^2}{2mr^2}\tag{8.31}

中的一维运动,其中 J22mr2\frac{J^2}{2mr^2} 可视为有效的离心势能。

​ 由式(8.25)得到

12mr˙2=EVeff(r)=EJ22mr2V(r)0(8.32)\frac 12m\dot r^2=E-V_{\mathrm{eff}}(r)=E-\frac{J^2}{2mr^2}-V(r)\ge 0\tag{8.32}

因此总能量不小于有效势能,即 EVeff(r)E\ge V_{\mathrm{eff}}(r) 。在总能量给定的情况下,径向坐标 rr 的运动范围由 r˙=0\dot r=0 ,即方程

EJ22mr2V(r)=0(8.33)E-\frac{J^2}{2mr^2}-V(r)= 0\tag{8.33}

决定。此方程的零点即轨道的转变点。

8.2.3 贝特朗定理

​ 对于有界运动,由式(8.29)知,在从 r1r_1r2r_2 ,再回到 r1r_1 的这一往复过程中,角度变化为

Δϕ=2t1t2Jr2dr2m(EV(r))J2r2(8.34)\Delta \phi=2\int_{t_1}^{t_2}\frac{J}{r^2}\frac{\mathrm dr}{\sqrt{2m(E-V(r))-\frac{J^2}{r^2}}} \tag{8.34}

若经过 nn 个周期的往复,轨道闭合,即满足

nΔϕ=m2π,m,n=1,2,3,(8.35)n\Delta \phi=m2\pi,\quad m,n=1,2,3,\cdots \tag{8.35}

对于一般的中心势场,有界运动的轨道都不闭合,此时经过无限长的时间,轨道铺满 r1r_1r2r_2 之间的圆环,如图所示

​ 数学上可以证明,只有

V1r2,Vr2(8.36)V\propto -\frac{1}{r^2},\quad V\propto r^2 \tag{8.36}

两种形式的中心势场,有限远动的轨道才是闭合的。这个结论即所谓贝特朗定理(Bertrand‘s theorem)。

8.3 开普勒问题

​ 到中心的距离成反比的中心势场

V(r)=αr(8.37)V(r)=-\frac \alpha r\tag{8.37}

是最常见也是最重要的一种势场,其中 α>0\alpha>0 对应吸引势,α<0\alpha<0 对应排斥势,对这一系统的求解称为开普勒问题(Kepler problem)。以下我们假定 α>0\alpha >0 。由式(8.31)知径向运动的有效势能为

Veff=αr+J22mr2(8.38)V_{\mathrm{eff}}=-\frac \alpha r+\frac{J^2}{2mr^2}\tag{8.38}

有效势能在 Veff=0V'_{\mathrm{eff}}=0 处存在极值,对应

rm=J2mα(3.39)r_m=\frac{J^2}{m\alpha} \tag{3.39}

且由于 Veff(rm)=α4m3J6>0V''_{\mathrm{eff}}(r_m)=\frac{\alpha^4m^3}{J^6}>0 ,所以是极小值,对应 (Veff)min=Veff(rm)=α2m2J2(V_{\mathrm{eff}})_{\min}=V_{\mathrm{eff}}(r_m)=-\frac{\alpha^2m}{2J^2} 。此外,有效势能曲线存在零点 Veff(r)=0V_{\mathrm{eff}}(r)=0 ,对应 r0=J22mαr_0=\frac{J^2}{2m\alpha}

8.3.1 开普勒问题的求解

​ 如图所示,根据系统能量的大小,可以将粒子的运动定性分为两类。当 (Veff)minE<0(V_{\mathrm{eff}})_{\min}\le E<0 时,式(8.33)有两个零点。粒子限制于 r1rr2r_1\le r\le r_2 的环状区域做有界运动,这种状态即束缚态。 r1r_1 被称作近日点(preihelion), r2r_2 被称为远日点(aphelion)。当 r1=r2=rmr_1=r_2=r_m 时,即 E=(Veff)minE=(V_{\mathrm{eff}})_{\min} ,轨道为半径 rmr_m 的正圆。当 E0E\ge0 时,式(8.33)有一个零点。此时存在近日点 r1r_1 ,但是不存在远日点。粒子可以运动至无穷远,因此做半无界运动。

​ 由式(8.29)可知,轨道方程即

ϕ(r)=Jmr2dr2m(E+αr)J2m2r2(8.40)\phi(r)=\int \frac{J}{mr^2}\frac{\mathrm dr}{\sqrt{\frac 2m\left(E+\frac \alpha r \right)-\frac{J^2}{m^2r^2}}} \tag{8.40}

引入

p:=J2mα,e:=1+2EJ2mα2(8.41)p:=\frac{J^2}{m\alpha},\quad e:=\sqrt{1+\frac{2EJ^2}{m\alpha^2}} \tag{8.41}

其中 pp 被称作半通径(semi latus rectum),ee 被称作偏心率(eccentricity)。积分式(8.40)可以解析积出

ϕ=drpr21e2(1pr)2=u=1prdue2u2=arcsin(ue)+ϕ0(8.42)\phi=\int\mathrm dr\frac p{r^2}\frac{1}{\sqrt{e^2-\left(1-\frac pr\right)^2}}\xlongequal{u=1-\frac pr}\int\frac{\mathrm du}{\sqrt{e^2-u^2}}=\arcsin\left(\frac ue \right)+\phi_0 \tag{8.42}

这里 ϕ0\phi_0 是积分常数,方便起见取 ϕ0=π2\phi_0=\frac \pi2 。于是轨道方程可以写成 u=ecosϕu=-e\cos\phi ,即

r(ϕ)=p1+ecosϕ(8.43)r(\phi)=\frac{p}{1+e\cos\phi}\tag{8.43}

式(8.43)描述圆锥曲线。根据总能量的大小,分为三种情形:椭圆,抛物线和双曲线。

​ 对应椭圆轨道,可以得到 r1=p1+er_1=\frac{p}{1+e}r2=p1er_2=\frac{p}{1-e} ,因此椭圆轨道的长轴为

2a=r1+r2=2p1e2=αE(8.44)2a=r_1+r_2=\frac{2p}{1-e^2}=\frac{\alpha}{|E|} \tag{8.44}

即椭圆轨道长轴只和粒子的能量 EE 有关,与椭圆形状无关。椭圆轨道的半短轴为

b=a1e2=J2mE(8.45)b=a\sqrt{1-e^2}=\frac{J}{\sqrt{2m|E|}} \tag{8.45}

与能量和角动量都有关。粒子沿椭圆轨道运动一周所需的时间即周期,有角动量守恒式(8.23)得 Jdt=mr2dϕJ\mathrm dt=mr^2\mathrm d\phi ,代入轨道方程(8.43)积分得到(也可直接利用椭圆面积公式)

T=02πmr2(ϕ)Jdϕ=mJ2πab=παm2E3=2πmαa3(8.46)T=\int_{0}^{2\pi}\frac{mr^2(\phi)}{J}\mathrm d\phi=\frac {m}{J}2\pi ab=\pi \alpha\sqrt{\frac{m}{2|E|^3}}=2\pi\sqrt{\frac m\alpha a^3} \tag{8.46}

这就是开普勒第三定理(third law of Kepler),即椭圆轨道周期的平方能量绝对值的三次方成反比,或者与半长轴的三次方成正比。

8.3.2 拉普拉斯-龙格-楞次矢量

​ 中心势场的空间转动不变性和时间平移不变性分别导致了角动量 J\boldsymbol J 和总能量 EE 的守恒。开普勒问题中轨道的闭合性意味着系统具有比时空对称性更高的对称性。这种对称性导致新的运动常数,即所谓拉普拉斯-龙格-楞次矢量(Laplace-Runge-Lenz vector),简称 LRL 矢量,定义为

A=p×Jαmrr(8.47)\boldsymbol A=\boldsymbol p\times\boldsymbol J-\alpha m\frac{\boldsymbol r}{r} \tag{8.47}

利用 pmr˙\boldsymbol p\equiv m\dot{\boldsymbol r}Jr×p\boldsymbol J\equiv \boldsymbol r\times\boldsymbol p ,LRL 矢量可以展开写成

A=m2r˙2rm2(r˙r)r˙αmrr(8.47)\boldsymbol A=m^2\dot{\boldsymbol r}^2\boldsymbol r-m^2(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot{\boldsymbol r}-\alpha m\frac{\boldsymbol r}{r}\tag{8.47}

由开普勒问题的运动方程(8.17)得 dpdt=mr¨=V(r)rrαr3r\frac{\mathrm d\boldsymbol p}{\mathrm dt}=m\ddot{\boldsymbol r}=-V'(r)\frac{\boldsymbol r}{r}\equiv-\frac{\alpha}{r^3}\boldsymbol r,于是

dAdt=dpdt×J+αm1r2r˙rαmr˙r=αr3r×J+αm1r2r˙rαmr˙r=αr3r×(r×p)+αm1r2r˙rαmr˙r=αr3[r(rp)r2p]+αm1r2r˙rαmr˙r=0(8.49)\begin{aligned} \frac{\mathrm d\boldsymbol A}{\mathrm dt}&=\frac{\mathrm d\boldsymbol p}{\mathrm dt}\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}\boldsymbol r\times\boldsymbol J+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}\boldsymbol r\times(\boldsymbol r\times\boldsymbol p)+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}\\ &=-\frac{\alpha }{r^3}[\boldsymbol r(\boldsymbol r\cdot \boldsymbol p)-r^2\boldsymbol p]+\alpha m\frac{1}{r^2}\dot r\boldsymbol r-\alpha m\frac{\dot{\boldsymbol r}}{r}=0 \end{aligned} \tag{8.49}

其中用到了 rp=mrr˙=12md(rr)dt\boldsymbol r\cdot \boldsymbol p=m\boldsymbol r\cdot\dot{\boldsymbol r}=\frac 12m\frac{\mathrm d(\boldsymbol r\cdot\boldsymbol r)}{\mathrm dt} ,因此 LRL 矢量确实是运动常数。

​ 可以验证

AJ=0(8.50)\boldsymbol A\cdot \boldsymbol J=0 \tag{8.50}

意味着 LRL 矢量 A\boldsymbol A 和角动量矢量 J\boldsymbol J 垂直,因此 LRL 矢量即位于轨道平面上。

​ 利用 LRL 矢量,可以以非常简洁的方式得到轨道方程。既然 LRL 矢量 A\boldsymbol A 处于轨道平面上且是常矢量,不妨取其作为轨道平面极坐标的极轴方向,即有 Ar=Arcosϕ\boldsymbol A\cdot \boldsymbol r=Ar\cos\phi 。另一方面

Ar=(p×J)rαmrrr=(r×p)Jαmr=J2αmr\boldsymbol A\cdot\boldsymbol r=(\boldsymbol p\times\boldsymbol J)\cdot\boldsymbol r-\alpha\frac{m}{r}\boldsymbol r\cdot\boldsymbol r=(\boldsymbol r\times\boldsymbol p)\cdot \boldsymbol J-\alpha mr=J^2-\alpha mr

于是可以解出轨道方程

r(ϕ)=J2αm+Acosϕ(8.51)r(\phi)=\frac{J^2}{\alpha m+A\cos\phi} \tag{8.51}

其正具有式(8.43)的形式。对比式(8.51)和(8.43),得到

p=J2mα,e=Amα(8.52)p=\frac{J^2}{m\alpha},\quad e=\frac{A}{m\alpha}\tag{8.52}

同时 A=mαeA=m\alpha e 意味着

A2=m2α2+2mEJ2(8.53)A^2=m^2\alpha^2+2mEJ^2\tag{8.53}

式(8.53)表明,LRL 矢量的大小并不是独立的,而是由总能量 EE 和角动量大小 JJ 决定。

​ 由 LRL 矢量的定义式(8.47),有 αmJ×rr=J×(p×JA)=pJ2J×A\alpha m\boldsymbol J\times\frac{\boldsymbol r}{r}=\boldsymbol J\times(\boldsymbol p\times\boldsymbol J-\boldsymbol A)=\boldsymbol pJ^2-\boldsymbol J\times\boldsymbol A ,两边同求内积,得到

(pJ×AJ2)2=(αmJ)2(8.54)\left(\boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} \right)^2=\left(\frac{\alpha m}{J}\right)^2\tag{8.54}

因为角动量守恒,式(8.54)表明 pJ×AJ2\boldsymbol p-\frac{\boldsymbol J\times\boldsymbol A}{J^2} 是一个长度固定为 αmJ\frac{\alpha m}{J} 的矢量,将其轨道平面取为 {x,y}\{x,y\}-平面,即有 J=Jez\boldsymbol J=J\boldsymbol e_zp=pxex+pyey\boldsymbol p=p_x\boldsymbol e_x+p_y\boldsymbol e_y 。令 LRL 矢量指向 xx 方向,即 A=Aex\boldsymbol A=A\boldsymbol e_x 。式(8.54)称为

px2+(pyAJ)2=(αmJ)2(8.55)p_x^2+\left(p_y-\frac{A}{J}\right)^2=\left(\frac{\alpha m}{J} \right) ^2\tag{8.55}

式(8.55)意味着在 {px,py}\{p_x,p_y\}-平面上,粒子的动量轨迹是圆心为 {px,py}={0,AJ}\{p_x,p_y\}=\left\{0,\frac{A}{J} \right\} ,半径为 αmJ\frac{\alpha m}{J} 的圆周,这正是开普勒问题具有比纯空间的转动不变性更高的对称性的反映。

8.3.3 开普勒问题的对称性

​ 开普勒问题中存在不同的轨道对应同一能量是一种不同于时空对称性的对称性的体现,这种对称性来源于势能 αr-\frac{\alpha}{r} 的特殊形式。

​ LRL 矢量所对应的直角坐标 xix^i 的无穷小变换为

δ(j)xi=ϵ[2x˙ixjxix˙j(rr˙)δij]i,j=1,2,3(8.56)\delta_{(j)}x_i=\epsilon[2\dot x_i x_j-x_i\dot x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})\delta_{ij}],\quad i,j=1,2,3\tag{8.56}

这里 ϵ\epsilon 为无穷小参数, jj 为给定某分量指标(在此方向的变换)。由式(8.56)得

δ(j)x˙i=ddt(δ(j)xi)=ϵ[2x¨ixj+x˙ix˙jxix¨jr˙2δij(rr¨)δij](8.57)\delta_{(j)}\dot x_i=\frac{\mathrm d}{\mathrm dt}\left(\delta_{(j)} x_i\right)=\epsilon[2\ddot x_ix_j+\dot x_i\dot x_j-x_i\ddot x_j-\dot {\boldsymbol r}^2\delta_{ij}-(\boldsymbol r\cdot \ddot{\boldsymbol r})\delta_{ij}] \tag{8.57}

开普勒问题作用量的变换为

Δ(j)S=dt(mr˙δ(j)r˙αr2δ(j)r)(8.58)\Delta_{(j)} S=\int \mathrm dt\left(m\dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}-\frac{\alpha}{r^2}\delta_{(j)} r \right)\tag{8.58}

计算可以得到

r˙δ(j)r˙=x˙iδ(j)x˙i=ϵddt[r˙2xj(r˙r)x˙j](8.59)\dot{\boldsymbol r}\cdot\delta_{(j)}\dot{\boldsymbol r}=\dot x^i\delta_{(j)}\dot x_i=\epsilon\frac{\mathrm d}{\mathrm dt}\left[\dot{\boldsymbol r}^2x_j-(\dot{\boldsymbol r}\cdot\boldsymbol r)\dot x_j \right] \tag{8.59}

1r2δ(j)r=1r3xiδ(j)xi=ϵddt(1rxj)(8.60)\frac{1}{r^2}\delta_{(j)} r=\frac{1}{r^3}x^i\delta_{(j)}x_i=-\epsilon\frac{\mathrm d}{\mathrm dt}\left(\frac 1rx_j \right)\tag{8.60}

其中用到 rr˙=ddt(rr)r˙r=12ddtr2=rr˙\boldsymbol r\cdot \dot{\boldsymbol r}=\frac{\mathrm d}{\mathrm dt}(\boldsymbol r\cdot \boldsymbol r)-\dot{\boldsymbol r}\cdot \boldsymbol r=\frac 12\frac{\mathrm d}{\mathrm dt}r^2=r\dot r

即都可以写成时间全导数的形式。代入式(8.58),即有

Δ(j)S=dtdF(j)dt,F(j)=ϵ[m(r˙2xj(rr˙)xj)+α1rxj](8.61)\Delta_{(j)} S=\int \mathrm dt \frac{\mathrm dF_{(j)}}{\mathrm dt},\quad F_{(j)}=\epsilon\left[m(\dot{\boldsymbol r}^2x_j-(\boldsymbol r\cdot \dot{\boldsymbol r})x_j)+\alpha \frac 1rx_j \right] \tag{8.61}

根据诺特定理,存在运动常数

Q(j)=1ϵ(Lx˙iδ(j)xiF(j))=mr˙2xjm(r˙r)x˙jαrxj1mAj,j=1,2,3(8.62)Q_{(j)}=\frac 1\epsilon\left(\frac{\partial L}{\partial \dot x_i}\delta_{(j)}x_i-F_(j) \right)=m\dot{\boldsymbol r}^2x_j-m(\dot{\boldsymbol r} \cdot \boldsymbol r)\dot x_j-\frac{\alpha}{r}x_j\equiv \frac{1}{m}A_j,\quad j=1,2,3 \tag{8.62}

正是 LRL 矢量。